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(57) Abstract 



The DNA of the invention are characterised in that they concern the whole or part of genes, with their reading frame, to be found 
in Neisseria meningitidis, but not in Neisseria gonorrhoeae, or in Neisseria lac tarn ic a except the genes involved in the biosynthesis of 
the polysaccharide capsule, frpA, frpC, opc t porA, rotamase the sequence IC1 106, IgA protease, pilline, pilC, transferrin binding proteins 
and opacity proteins. The invention also concerns the polypeptides corresponding to these DNA and the antibodies directed against these 
polypeptides. It is applicable in the prevention and the detection of meningococcus induced infections and meningitis. 

(57) Abrege* 

Les ADN de r invention sont caractenses en ce qu'il s'agit de tout ou partie de genes, avec leur phase de lecture, presents chez 
Neisseria meningitidis, mais absents soit chez Neisseria gonorrhoeae, soit chez Neisseria lactamica a l'exception des genes implique's dans 
la biosynthese de la capsule polysaccharidique, frpA, frpC, opc, porA, rotamase, de la sequence IC1106, des IgA proteases, de la pilline, 
de pilC, des prolines qui Hem la transferrine et des procaines d'opacitl. L' invention vise fgalement les polypeptides correspondant a ces 
ADN et les anticorps diriges contre ces polypeptides. Applications a la prevention et & la detection d* infections a mtfningocoques et de 
rneningites. 
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ADN et proteines ou peptides specifiques des 
bacteries de l'espece Neisseria meningitidis, leurs 
procedes d'obtention et leurs applications biologiques . 

5 L f invention est relative aux ADN, et aux proteines 

et peptides , specifiques des bacteries de l'espece 
Neisseria meningitidis (ci-apres en abrege Nm), a leur 
procede d'obtention et a leurs applications biologiques, 
en particulier pour la prevention et la detection 

10 d f infections a meningocoques et de meningites . 

On sait que Nm constitue 1 ' un des principaux agents 
de la meningite cerebrospinale. 

Des etudes menees aux Etats-Unis ont montre que de 5 
a 10% de la population sont porteurs asymptornatiques de 

15 souche(s) de Nm. Les facteurs de transmission de Nm sont 
mal connus . Pour une proportion des personnes infectees, 
Nm penetre le flux sanguin, ou elle peut provoquer une 
meningococcemie et/ou progresse dans le flux 
cerebrospinal pour provoquer une meningite- Sans 

20 traitement antibiotique rapide, 1 r infection peut se 
developper de maniere fulgurante et devenir mortelle. 

Comparee aux autres pathogenes, Nm presente la 
caracteristique de pouvoir franchir la barriere hemato- 
encephalique afin de coloniser les meninges. L f etude de 

25 la pathogenicity de Nm est done non seulement iraportante 
dans le cadre de la meningite, mais aussi dans le cadre 
de toute maladie touchant le cerveau. 

On congoit alors l'interet de disposer d'outils 
specifiques de cette espece bacterienne pour les 

30 applications envisagees ci-dessus. 

Nm est genetiquement tres proche des bacteries de 
l'espece Neisseria gonorrhoeae (ci-apres en abr6ge Ng) et 
de l'espece Neisseria lactamica (ci-apres en abrege Nl ) . 
Leur pathogenicity est toutefois tres differente. 
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Nm colonise le nasopharynx, puis traverse 
1' epithelium pharynge pour envahir 1 * espace sous- 
muqueux, etant alors responsable de septicemie et de 
meningite . 

Ng est surtout responsable d' infections localisees 
du tractus genito-urinaire . Elle colonise la muqueuse 
genitale, puis traverse 1 • epithelium, envahit ensuite le 
sous-epithelium ou elle se multiplie et est responsable 
d'une forte reaction inf lammatoire. Des infections 
gonococciques disseminees sont possibles, inais restent 
rares et sont le fait de seulement certaines souches. 
Quant 4 Nl, on considere qu ' il s ' agit d'une souche non 
pathogene, etant donne qu'elle n'est pas responsable 
d' invasion localisee ou generale. 

Ainsi, une premiere consideration amene a prendre en 
compte le fait que Nm et Ng , tout en etant des bacteries 
tres proches, presentent des pouvoirs pathogenes 
dif f erents . 

Le genome de ces bacteries etant fortement 
homologue, seules des parties limitees du genome de Nm et 
de Ng doivent coder pour des facteurs de virulence 
specif iques, responsables de leur pathogeneses 

II est clair que Nm presente par rapport a Ng des 
sequences d'ADN qui lui sont specif iques et qui doivent 
25 intervenir au niveau de 1 T expression de son pouvoir 
pathogene specif ique . 

L'espece Nm est subdivisee en serogroupes bases sur 
la nature des polysaccharides capsulaires. 

Au moins 13 serogroupes ont ete definis, parmi 
lesquels les serogroupes A, B et C sont responsables 
d' environ 90% des cas de meningites. Les groupes A et C 
sont observes dans les formes epidemiques de la maladie. 
Le groupe B est le serogroupe le plus couramment isole en 
Europe et aux Etats-Unis. 



20 
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La capsule, presente chez Nm et absente chez Ng, a 
servi de base pour 1 ' elaboration de vaccins anti- 
meningite meningococcique . 

Les polysaccharides de la capsule de Nm ont ete 
5 utilises pour 1 1 elaboration d'un vaccin qui s'est montre 
efficace pour prevenir chez les adultes la meningite 
provoquee par les meningocoques de serogroupes A, C, W135 
et Y. 

Cependant, le polysaccharide de Nm groupe C s'est 

10 revele faiblement inununogene chez les enfants de moins de 
deux ans, alors que le polysaccharide de Nm groupe B est 
non inununogene chez 1 1 horrune et partage des epitopes avec 
des glycoproteines d' adhesion presentes dans les cellules 
neuronales humaines . 

15 II n'existe done pas de vaccin universel capable de 

prevenir les infections provoquees par l f ensemble des 
serogroupes des meningocoques et capable de repondre a la 
variabilite antigenique propre aux pathogenes bacteriens 
en general et a Nm en particulier. 

20 En raison de la reactivite croisee du polysaccharide 

groupe B de Nm avec les antigenes humain, de la 
multiplicity des serogroupes et de la variabilite 
antigenique de Nm, les strategies proposees a ce jour ne 
peuvent conduire a un vaccin efficace dans toutes les 

25 situations. 

Les recherches se sont alors concentrees sur 1 1 etude 
d ' elements caracteristiques responsables de la 
specif icite de la pathogenese meningococcique. 

La plupart des genes qui ont ete etudies dans 1 ' une 

30 quelconque des deux bacteries Nm ou Ng possedent leur 
homologue dans la deuxieme bacterie, 

De la meme maniere, la plupart des facteurs de 
virulence jusqu f ici identifies dans Nm ont une 
contrepartie dans Ng, e'est-a-dire la piline, les 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



B NSOO CID- <WO _9802547A2J > 



WO 98/02547 



4 



PCT/FR97/0129S 



proteines Pile, les proteines d'opacite et les recepteurs 
de la lactoferrine et de la transf errine . 

Les attributs specif iques des meningocoques 
caracterises dans 1 ' art anterieur sont la capsule, les 
5 proteines Frp analogues aux toxines RTX, les proteines de 
la membre externe Opc, la peroxydase glutathione, la 
porine PorA et le gene rotamase. 

Parmi ceux-ci, seule la capsule est invariablement 
presente dans les souches virulentes de Nin. Cependant, de 
10 nombreux pathogenes extra-cellulaires possedent une 
capsule sans pour autant traverser la barriere hemato- 
encephalique . 

Des attributs non encore identifies doivent done 
etre responsables de la specificite de la pathogenese 

15 meningococcal. Ces attributs sont vraisemblablement 
codes par des sequences d * ADN presentes panni les 
meningocoques mais absentes chez les gonocoques. 

Les inventeurs ont developpe une nouvelle voie 
d ' approche basee sur 1 ' isolement soustractif des genes 

10 Nm-specifiques, ces genes devant etre lies a la 
pathogenese specifique de Nm, et, plus particulierement 
au f ranchissement de la barriere hemato-encephalique . 

La methode soustractive developpee dans 1 f art 
anterieur a abouti a la production de marqueurs 

£5 epidemologiques pour certains isolats de Nm. Ces 
marqueurs sont d'une utilite limitee : ils ne couvrent 
pas 1 ! ensemble des serogroupes de l'espece Nm. 

Par contraste avec ces etudes, les travaux des 
inventeurs ont conduit, en confrontant Nm a I 1 ensemble du 

^0 chromosome de Ng, cisaille de maniere al^atoire, a la 
mise au point de moyens pour doner 1 • ensemble des ADN 
presents chez Nm et absents chez Ng, fournissant ainsi 
des outils de haute specificite vis-a-vis de Nm et 
permettant ainsi de repondre pour la premiere fois a la 

5 variability genetique de l'espece. 
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Les termes "present" et " absent " , tel qu ' utilises 
dans la description et les revendications en rapport avec 
les ADN d'une souche, ou leurs produits d 1 expression, 
sont apprecies par rapport a des conditions d 1 hybridation 
identiques ( 16h a 65 avec NaP0< 0,5M, pH 7,2; EDTA-Na 
0,001m, 1%,1% d'albumine de serum bovin et 7% de 
dodecylsulf ate de sodium), en utilisant une meme sonde et 
une meme intensite de marquage de la sonde, une meme 
quantite d'ADN chromosomique et un meme element de 
comparaison (ADN chromosomique de la souche homologue). 
Ainsi, on considere que 1 ' ADN est present lorsque le 
signal obtenu avec la sonde est pratiquement le meme que 
celui obtenu avec la souche de reference. 

En revanche, on considere que 1 * ADN est absent 
lorsque ce signal apparait tres faible. 

Une deuxieme consideration sur les pathogenicites de 
Nm et de Ng conduit a prendre en compte leur aptitude 
commune a coloniser et & penetrer la muqueuse puis a 
envahir l'espace sous-epithelial de cette derniere. II 
est fort vraissemblable que ce processus implique des 
f acteurs de virulence communs aux deux pathogenes . A cet 
egard, on sait qu'un certain nombre de f acteurs de 
virulence ont ete deja identifies chez Nm et chez Ng, 
comme les proteines pili, PilC, les proteines d'opacite, 
les proteases d'IgA, les proteines de liaison a la 
transferrine et a la lactof errine, et des 
lipooligosaccharides . 

La demarche des inventeurs s'est done etendue a la 
recherche de regions de Nm, sp6cifiques de Nm et de Ng, 
mais absentes chez 1 ' espece non pathogene Nl, et d'une 
maniere generale a la recherche, par les moyens mis au 
point conf ormement a 1' invention, de regions 
chromosomiques d'ADN et de leurs produits d ' expression, 
specif iques d'une espece donnee. 
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L' invention a done pour but de fournir des ADN de Nm 
specifiques de son pouvoir pathogene et des moyens pour 
les obtenir, notamment en elaborant des banques formees 
exclusivement de ces ADN Nm-specif iques . 
5 Elle vise egaiement les produits derives de ces 

sequences d'ADN. 

L f invention vise egaiement la mise a profit des 
caracteres specifique et exhaustif de ces banques pour 
elaborer des outils utilisables notamment en diagnostic, 
10 therapie et prevention. 

Les ADN de 1 ' invention sont caracterises en ce qu'il 
s'agit de tout ou partie de genes, avec leur phase de 
lecture, presents chez Neisseria meningitidis, mais 
absents soit chez Neisseria gonorrhoeae, soit chez 
15 Neisseria lactamica, a 1* exception des genes impliques 
dans la biosynthese de la capsule polysaccharidique, 
frpA, frpC, opc, por A, rotamase, de la sequence IS1106, 
des IgA proteases, de la pilline, de pile, des proteines 
qui lient la transferrine et des proteines d'opacite. 

Comme precise plus haut, les termes "presents' 1 et 
"absents'' sont apprecies par rapport aux conditions 
d ' hybridation telles qu'utilisees dans les Southern blots 
decrits dans les exemples et rappelees plus haut. 

On notera que ces ADN englobent les variants des 
lors qu'ils expriment une fonction propre a 1 1 espece Nm, 
plus particulierement un phenotype retrouv& uniquement 
chez Nm ou en commun exclusivement avec Ng. 

Selon un aspect majeur, ces ADN sont specifiques de 
la pathogenecite de Neisseria meningitidis et ce, en 
depit de la variability genetique de cette espece, 

Selon un mode de realisation de 1* invention, lesdits 
ADN sont specifiques de Nm par rapport £ Ng. 

Plus particulierement, les ADN Nm-specif iques sont 
absents de Neisseria lactamica et de Neisseria cinerea. 



20 
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De fagon surprenante, la majorite des differences 
genetiques entre les souches de meningocoques et celles 
de gonocoques apparaissent regroupees en regions 
distinctes, qui correspondraient a des ildts de 
5 pathogenicities comme precedemment decrit pour E. call et 
Y - pestis. 

Ainsi, dans une disposition preferee de 1' invention, 
ces ADN sont egalement caracterises en ce qu'ils 
comprennent une ou plusieurs sequence(s), teile(s) que 

10 presente(s) sur le chromosome de Neisseria meningitidis 
Z2491 entre tufh et pllT , ou region 1 du chromosome, 
et/ou la ou les sequence(s) capable(s) de s 1 hybrider avec 
la ou les sequence(s) ci-dessus, sous reserve d'etre 
specif ique( s ) de Neisseria meningitidis. 

15 Par " specif ique" , on designe dans la description et 

les revendications les sequences de nucleotides qui ne 
s ' hybrident qu * avec celles de Nm, dans des conditions 
d ' hybridation donnees dans les exemples et rappelees plus 
haut . 

20 On notera a cet egard que, de maniere generale, 

lorsqu'on fait reference dans la description et les 
revendications a "tout ou partie" d'une sequence, cette 
expression doit etre appreciee par rapport a la 
specif icite definie ci-dessus, 

25 De meme, tout ou partie d ! un peptide, ou un fragment 

d 1 un peptide ou d'un anticorps designe un produit 
presentant les proprietes biologiques respectivement du 
peptide natif ou de l f anticorps forme contre le peptide. 

Dans la region 1, sont regroupes des genes de la 

30 capsule de Neisseria meningitidis. 

Des ADN de ce type pr6sentent une sequence 
correspondant, pour tout ou partie, a SEQ ID N*9, 13, 22 
ou 30, et/ou a toute sequence se situant a plus ou moins 
20 kb de ces SEQ ID sur le chromosome d'une souche de Nm, 

35 et/ou presentent une sequence capable de s 1 hybrider avec 
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au moins un fragment de l'une quelconque de ces 
sequences - 

Dans une autre disposition preferee de 1' invention, 
ces ADN sont egalement caracterises en ce qu'ils sont 
constitues par une ou plusieurs sequence(s), telle(s) que 
presente(s) sur ie chromosome de Neisseria meningitidis 
Z2491 entre pilQ et A740, ou region 2 du chromosome, 
et/ou la ou les sequence(s) capable(s) de s'hybrider 
avec la ou les sequence(s) ci-dessus, sous reserve d'etre 
specif ique( s ) de Neisseria meningitidis . 

Des ADN selon cette disposition presentent une 
sequence correspondant , pour tout ou partie, a SEQ ID 
N*l, 2, 4, 6, 7, 10, 15, 31 ou 34, et/ou a toute sequence 
se situant a plus ou moins 20 kb de ces SEQ ID sur le 
chromosome d'une souche de Nm, et/ou presentent une 
sequence capable de s'hybrider avec au moins un fragment 
de 1 ' une quelconque de ces sequences . 

L f invention vise tout specialement tout ou partie de 
la sequence d 1 ADN SEQ ID N # 36 de 15620 pb, et les 
sequences correspondant aux cadres ouverts de lecture SEQ 
ID N'37, SEQ ID N* 38, SEQ ID N" 39, SEQ ID N* 40, SEQ ID 
N- 41, SEQ ID N # 42, SEQ ID N' 43, SEQ ID N # 44 et 
SEQ ID N # 45. 

Dans encore une autre disposition preferee de 
1' invention, ces ADN sont egalement caracterises en ce 
qu'ils sont constitues par une ou plusieurs sequence(s), 
telle(s) que presente(s) sur le chromosome de Neisseria 
meningitidis 22491 entre argF et opaB, ou region 3 du 
chromosome, et/ou la ou les sequence(s) capable(s) de 
s'hybrider avec la ou les sequence(s) ci-dessus, sous 
reserve d'etre specif ique( s ) de Neisseria meningitidis. 

Des ADN selon cette disposition sont caracterises en 
ce qu'ils presentent une sequence correspondant pour tout 
ou partie a SEQ ID N*8, 21, 23, 25, 26, 28, 29, 32 ou 35, 
et/ou a toute sequence se situant a plus ou moins 20 kb 
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de ces SEQ ID sur le chromosome d'une souche de Nm, 
et/ou, presenters une sequence capable de s 1 hybrider avec 
au moins un fragment de l'une quelconque de ces 
sequences . 

5 Les regions 1, 2, 3, identifiees ci-dessus, 

presentent une forte proportion de sequences Neisseria 
meningitidis specif iques, et entrent egalement dans le 
cadre de 1' invention. 

D'autres ADN representatif s de la specif icite vis-a- 

10 vis de Neisseria meningitidis presentent une ou plusieurs 
sequences telle(s) que presente(s) sur le chromosome de 
Neisseria meningitidis Z2491, mais ne font pas partie des 
regions 1, 2, 3 definies ci-dessus. 

De tels ADN comprennent une ou plusieurs sequences 

15 correspondant pour tout ou partie a SEQ ID n*3, 5, 11, 
12, 14, 16, 18, 19, 20, 24, 27 ou 33, et/ou a toute 
sequence se situant a plus ou moins 20 kb de ces SEQ ID 
sur le chromosome d'une souche de Nm, et/ou presentent 
une sequence capable de s ! hybrider avec de telles 

20 sequences. 

Compte tenu des applications particulierement 
visees, 1 ' invention concerne plus specialement les ADN 
ci-dessus impliques dans la pathogenese de l f organisme 
bacterien. 

25 Elle vise, en particulier, les ADN repondant a au 

moins l'une des caracterisations donnees ci-dessus, et 
codant pour une proteine exportee au-dela de la membrane 
cytoplasmique et/ou dont tout ou partie de leur sequence 
correspond a la region conservee desdits ADN, 

30 Ainsi, selon un autre mode de realisation de 

1* invention, les ADN sont communs avec ceux de Ng, mais 
sont absents de chez Nl. 

II s f agit plus specialement d'ADN presents sur la 
region 4 ( arg J a reg F) ou sur la region 5 (marqueur 

35 lambda 375 a pen A) sur le chromosome de Nm Z2491 et/ou 
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capables de s'hybrider avec lesdits ADN presents, sous 
reserve d'etre specif iques de Nm et de Ng par rapport a 
Nl. 

Par ? ' specif ique de Nm et de Ng par rapport a Nl" , 
5 on designe des ADN qui s 1 hybrident avec les ADN de Nm et 
de Ng dans les conditions d 1 hybridation des exemples 
(voir en particulier 1 r exemple 4). 

Les ADN des regions 4 et 5, et ceux capables de 
s T hybrider avec ces ADN, sous reserve d ' exprimer les 
10 fonctions propres a Nm, presentent 1 ' avantage 
d 1 intervenir de maniere majeure dans la virulence de Nm, 
en etant impliques dans l'etape de colonisation et de 
penetration initiales et dans la dissemination 

septicemique . 

15 Selon d'autres dispositions, 1 ' invention vise les 

vecteurs de transfert et d 1 expression, tels que 
plasmides, cosmides ou bacteriophages, comportant au 
moins un ADN tel que defini ci-dessus. 

Elle vise aussi les cellules hotes telles que 

20 transformees par au moins un ADN tel que defini ci- 
dessus . 

D'autres cellules hotes de 1' invention comportent 
des genes ou des fragments de genes specifiques de Nm et 
sont caracterisees en ce que leur chromosome est delete 
25 d'au moins un ADN selon 1 1 invention, en particulier d'un 
ADN responsable de la pathogenicity . II s 1 agit plus 
specialement de cellules bacteriennes, notamment de Nm. 

L ! invention a egalement pour objet les ARN dont la 
sequence correspond pour tout ou partie a la 
30 transcription d'au moins une sequence ou fragment de 
sequence d ' ADN tel que defini ci-dessus. 

Les acides nucleiques anti-sens des ADN tels que 
d6finis ci-dessus, ou de fragments de ces ADN, font 
egalement partie de 1' invention. 
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Ces acides nucleiques anti-sens portent le cas 
echeant au moins un substituant telle qu f un groupe 
methyle et/ou un groupe glycosyle. 

D'autres produits entrant dans le champ de 
5 1 1 invention sont constitues par des polypeptides. 

Ces polypeptides sont caracterises en ce qu'ils 
presentent un enchainement d ! acides amines correspondant 
a tout ou partie d 1 une sequence telle que codee par les 
acides nucleiques definis dans ce qui precede, ou telle 
10 que deduite des sequences de ces acides nucleiques. 

II s'agit avantageusement de polypeptides 
correspondant a tout ou partie de polypeptides exportes 
au-dela de la membrane cytoplasmique , plus specialement 
de polypeptides correspondant a tout ou partie de ceux 
15 tels que codes par une region conservee. 

En variante, les polypeptides de 1 1 invention peuvent 
etre modifies par rapport a ceux correspondant aux 
sequences d 1 acides nucleiques, et ce de maniere a etre 
particulierement adaptes pour une application donnee, en 
20 particulier une application vaccinale. 

Par modification, on entend toute alteration, 
deletion, substitution chimique, des lors qu'elle 
n'affecte pas les proprietes biochimiques des 
polypeptides natifs correspondants , plus specialement des 
25 proteines f onctionnelles telles qu'exportees au niveau du 
periplasme et de la membrane externe. 

D'autres produits conformes a 1 ! invention sont 
constitues par les anticorps diriges contre les 
polypeptides ci-dessus . 
30 L ' invention vise ainsi les anticorps polyclonaux, 

ainsi que les anticorps monoclonaux, caracterises en ce 
qu'ils reconnaissent au moins un epitope d ' un polypeptide 
tel qu ' evoque plus haut. 

Elle vise egalement les fragments de ces anticorps, 
35 plus particulierement les fragments Fv, Fab, Fab 1 2. 
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Les anti-anticorps capables de reconnaitre les 
anticorps definis ci-dessus, ou leurs fragments, selon 
une reaction de type antigene-anticorps , font egalement 
partie de 1' invention, 

Conformement a 1' invention, les differents produits 
consideres ci-dessus sont obtenus par voie de synthese 
et/ou biologique en operant selon les techniques 
classiques ♦ 

Les acides nucleiques peuvent etre egalement obtenus 
a partir de banques constitutes d 1 ADN Nm- specif iques, 
telles qu'elaborees selon une technique soustractive , 
cette technique comprenant : 

- le melange de deux populations d'ADN, 

la realisation d'au moins une iteration 
d 1 hybridation-amplification sous-tractive, et 

- la recuperation du ou des ADN souhaites, 
suivie le cas echeant de leur purification avec 
1 f elimination des sequences redondantes . 

Conformement a 1' invention, les deux 
populations d'ADN proviennent respectivement d ' une souche 
de Neisseria meningitidis, dite souche de reference, pour 
laquelle la banque specif ique doit etre constitute , et 
d'une souche de Neisseria, dite souche de soustraction, 
presentant une homologie en sequences primaires d * ADN 
superieure a environ 70% avec la souche de Neisseria 
meningitidis, les sequences d'ADN des souches de 
soustraction et de reference etant telles qu'obtenues 
respectivement par cisaillement aleatoire, et par clivage 
par une endonuclease de restriction capable de produire 
des fragments de taille inferieure a environ Ikb. 

L* invention vise en particulier un procede 
d'obtention de banques d'ADN Neisseria meningitidis 
specif iques, comportant les etapes de : 

- cisaillement aleatoire de 1 f ADN chromosomique 
d'une souche Neisseria gonorrhoeae, dite souche de 
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soustraction, notamment par passages repetes a travers 
une seringue , 

- clivage de I'ADN chromosomique d r une souche 
de Neisseria meningitidis , dite souche de reference, de 

5 preference par une enzyme de restriction produisant des 
fragments de taille inferieure a Ikb environ, 

- ligature des fragments d'ADN de la souche de 
reference, clives par 1 1 enzyme de restriction, avec des 
amorces oligonucleotidiques appropriees , 

10 - realisation d ' une iteration d 1 hybridation- 

amplification soustractive par : 

. melange des deux populations d'ADN dans des 
conditions appropriees pour 1 ' hybridation des sequences 
homologues, puis 

15 . amplification des fragments auto-reanneles et 

recuperation de ces fragments, 

. digestion de ces fragments par une enzyme de 
restriction, et re-ligature a des amorces 
oligonucleotides suivie d ' une 

20 - purification de 1 ' ADN ligature, et le cas 

echeant, d ! une nouvelle iteration d 9 hybridation 
soustractive, comportant le melange de fragments d'ADN de 
Neisseria gonorrhoeae cisaille comme indique ci-dessus 
avec les fragments d'ADN de Neisseria meningitidis issus 

25 de 1 ' iteration precedente, suivi, si on le souhaite du 
clonage des ADN de la banque. 

Les amorces utilisees sont des amorces 
oligodesoxynucleotidiques adaptees a 1 ' endonuclease de 
restriction utilisee et perraettant une insertion dans un 

30 site de clonage, tel que le site EcoRI du plasmide 
pBluescript. On choisira avantageusement de telles 
amorces parmi les oligodesoxynucleotides references dans 
le listing de sequence sous SEQ ID n*36 a 45. 
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Les banques ainsi obtenues sont formees d'ADN 
specifiques des meningocoques et absents chez les 
gonocoques . 

La specificite des ADN a ete verifiee cotnme expose 
dans les exemples, a chaque iteration par Southern blots, 
avec des genes communs a la souche de soustraction et a 
la souche de reference, ou avec 1 1 ADN total de chacune 
des souches digere par une endonuclease de restriction, 
telle que Clal. 

A chaque iteration, a egalement ete verifiee 
1 * exhaustivite de la banque d'ADN par Southern blotting 
avec des sondes connues pour etre specifiques de la 
souche de reference, a savoir pour Neisseria 
meningitidis , les genes frp, opc, rotamase, notamment. 

Les experiences realisees ont montre que les banques 
obtenues selon le precede de 1 ' invention sont depourvues 
des genes presentant une homologie significative avec des 
especes de Neisseria autre que Neisseria meningitidis, 
par exemple les genes, ppk ou pllCl, et ce generalement , 
en seulement 2 ou 3 iterations. 

Si necessaire, deux voies, non exclusives l'une de 
1 ! autre, peuvent etre empruntees . 

II est possible de proceder a une (n+l) eme 
iteration, en utilisant 1 1 ADN de 1 ! iteration n comme 
population d'ADN de la souche de reference. 

En variance, on realise une deuxieme banque, 
independante de la premiere, avec une enzyme de 
restriction de specificite differente de celle utilisee 
dans la premiere banque, par exemple Miol. 

Dans tous les cas, il est preferable de conserver 
chacun des produits issus de chacune des iterations 
realisees. 

L' invention vise egalement 1 ' utilisation de la 
technique soustractive decrite ci-dessus pour obtenir des 
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banques d 1 ADN communs entre Nm et Ng, rnais specif iques 
par rapport a Nl . 

On constitue avantageusement trois banques 
differentes, dont deux par digestion de I * ADN 
chromosomique de Nm par Mbol et Tsp5091, et la 
troisieme , par digestion de l'ADN chromosomique de Nm 
avec Mspl . Deux series de soustraction permettent de 
recuperer des ADN presentant la specificite recherchee, 
comtne decrit dans les exemples. 

Le procede d'obtention de ces banques et les banques 
elles-memes font egalement partie de 1' invention. 

On observera que, de maniere generale, le procede de 
1 ' invention est applicable pour l'obtention de banques 
d ' ADN specif iques d'une espece de cellule donnee ou d 1 un 
variant donne d'une meme espece, des lors qu'il existe 
une autre espece ou un autre variant proche genomiquement 
et exprimant des pouvoirs pathogenes differents. 

En appliquant le procede de 1' invention, on 
constituera avantageusement des banques d * ADN specif iques 
d ' especes donnees de cryptocoques , d 1 Haemophll us , de 
pneumocoques ou encore d f Escherichia coll, ou plus 
generalement de tout agent bacterien appartenant a la 
meme espece et disposant de pathovars differents. 

De meme, a partir de ces banques, 1 1 invention 
fournit les moyens de disposer de facteurs de virulence 
specif iques d'une espece ou d'un variant donne. 

De telles banques constituent done des outils 
presentant un int^ret majeur pour disposer d'attributs 
responsables de la specificite d'un pathogene, cette 
application etant plus specialement illustree 
conf ormement a 1 r invention par 1 1 obtention de banques 
renfermant les attributs responsables de la specificite 
de la pathogenese meningococcique. 

L ! etude des produits de l f invention, acides 
nucleiques, polypeptides et anticorps, a permis de mettre 



FEUILLE DE REMPLACEMENT (REGLE 2© 



WO 98/02547 , 6 PCT/FR97/01295 



10 



en evidence une specificite absolue vis-a-vis de 
Neisseria meningitidis, quelle que soit la souche et sa 
variability. 

Ces produits sont done particulierement appropries 
pour le diagnostic ou la prevention des infections et 
meningites provoquees par Neisseria meningitidis, que ce 
soit chez l'adulte ou 1 ' enfant et quel que soit le 
serogroupe de la souche en cause. 

La methode de diagnostic, selon 1' invention, d'une 
infection meningococcique, et plus particulierement de la 
meningite meningococcique, par mise en evidence de la 
presence de Neisseria meningitidis dans un echantillon a 
analyser, est caracterise par les etapes de : 

- mise en contact, d'un echantillon a analyser, a 
15 savoir un echantillon biologique ou une culture 

cellulaire, avec un reactif elabore a partir d'au moins 
un acide nucleique tel que defini ci-dessus, le cas 
echeant sous forme de sonde nucleotidique ou d' amorce, ou 
en variante a partir d'au moins un anticorps, ou un 
fragment d' anticorps, tel que defini ci-dessus, dans des 
conditions permettant respectivement une hybridation ou 
une reaction de type antigene-anticorps , et 

- revelation du produit de reaction eventuellement 
forme . 

Lorsque le reactif est elabore a partir d'un acide 
nucleique, celui-ci peut se presenter sous forme de sonde 
nucleotidique dans laquelle 1 ' acide nucleique, ou un 
fragment de ce dernier, est marque afin de permettre sa 
revelation. Des marqueurs appropries comprennent des 
marqueurs radio-actifs, f luorescents, enzymatiques ou 
luminescents . 

En variante, 1 * acide nucleique est inclus dans une 
cellule hote, utilisee comme reactif. 



20 



25 



30 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



WO 98/02547 PCT/FR97/0I295 



17 



10 



15 



20 



25 



Dans ces differentes formes, l'acide nucleique est utilise 
tel quel ou sous forme d 1 une composition avec des vehicules 
inertes . 

Lorsque ie reactif est elabore a partir d'un anticorps, ou 
d'un fragment d' anticorps, celui-ci peut etre marque aux fins 
de revelation. Le plus couramment, on utilise un marqueur 
fluorescent, enzymatique, radio-actif ou luminescent. 

L' anticorps, ou le fragment d' anticorps utilise, ie cas 
echeant, marque, peut etre utilise tel quel ou sous forme d'une 
composition avec des vehicules inertes. 

L ' echantiilon utilise dans 1 ' etape de mise en contact est 
un echantiilon biologique, issu d'un mammifere, tel que iiquide 
cephalo-rachidien, urine, sang, salive. 

L 1 etape de revelation est realisee dans des conditions 
permettant de mettre en evidence le produit de reaction 
lorsqu'il s'est forme. Des moyens classiques mettent en oeuvre 
des reactions de fluorescence, luminescence, colorees, radio- 
actives ou encore des techniques d • autoriadographie . 11 est 
egalement possible de quantifier le produit. 

Les produits marques, acides nucleiques et anticorps font 
egalement partie en tant que produits nouveaux de 1' invention. 

La methode definie ci-dessus peut stre appliquee au 
diagnostic d'une reaction immunitaire specif ique d'une 
infection meningococcique . 

On utilise alors comme reactif un polypeptide conforme a 
1' invention, tel que code par lesdites sequences d' acides 
nucleiques, correspondant au produit natif, ou un polypeptide 
modifie, mais possedant l'activite biologique et immunologique 
de polypeptide natif correspondant. 
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II s'agit avantageusement d ' un polypeptide tel 
qu'exporte au-dela de la membrane cytoplasmique de 
Neisseria meningitidis, plus particulierement de la 
partie d ' un tel polypeptide correspondant a la region 
5 conservee de l'ADN. 

L ' invention vise egalement des kits pour la mise en 
oeuvre des methodes definies ci-dessus. Ces kits sont 
caracterises en ce qu'ils comportent : 

- au moins un reactif tel que defini ci-dessus, a 
10 savoir de type acide nucleique, anticorps ou polypeptide, 

- les produits, notamment marqueurs ou tampons, 
permettant la realisation de la reaction d ' hybridation 
nucleotidique ou de la reaction immunologique visee, 
ainsi qu ' une notice d ' utilisation . 

La specif icite des produits de 1 * invention et leur 
localisation sur le chromosome de Neisseria meningitidis 
Z2491 soit regroupes en region, pouvant etre interpreters 
comme des Hots de pathogenecite , soit isoles sur le 
chromosome, leur conferent un interet tout particulier 
pour la realisation de compositions vaccinales a visee 
universelle, c'est-a-dire quelque soit la souche et la 
variability qu'elle exprime. Ces compositions peuvent 
inclure dans leur spectre d ' autres prophylaxies, et etre, 
par exemple, associees aux vaccins de l'enfance. 

L' invention vise done des compositions vaccinales 
incluant dans leur spectre une prophylaxie a visee anti- 
meningococcique, destinees a prevenir toute infection 
susceptible d'etre provoquee par Neisseria meningitidis, 
ces compositions etant caracterisees en ce qu'elles 
comprennent, en association avec un ou des vehicule(s) 
physiologiquement accept able( s ) , une quantite efficace de 
polypeptides ou d * anti-antricorps ou de leurs fragments 
tels que definis ci-dessus, ces produits etant 
eventuellement conjugues, afin de renforcer leur 
immogenici te . 



20 
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Des molecules immunogenes utilisables comprennent la 
proteine de polyovirus, la toxine tetanique, ou encore la 
proteine issue de la region hypervariable d f une piline. 

En variante, les compositions vaccinales selon 
5 1 1 invention sont caracterisees en ce qu'elles 
comprennent, en association avec un/des vehicule(s) 
physiologiquement acceptable(s), une quantite efficace : 

- d'acides nucleiques tels que definis ci-dessus, 

- de cellules hotes transformees telles que definies 
10 plus haut, ou 

- de cellules de Nm dont le chromosome a ete delete 
d ' au moins une sequence d 1 ADN selon 1 ' invention impliquee 
dans la pathogenicity de la bacterie . Le materiel 
nucleotidique utilise est avantageusement place sous le 

15 controle d'un promoteur favorisant son expression in vivo 
et la synthese de la proteine correspondante . II est 
egalement possible afin de renforcer 1 1 immunogenic! te, 
d ' associer ce materiel nucleique avec un ADN ou un ARN 
encodant une molecule porteuse telle que proteine de 

20 polyovirus, toxine tetanique, proteine issue de la region 
hypervariable d ' une piline. 

Les compositions vaccinales de 1 1 invention sont 
administrables par voie parenterale, sous-cutanee, 
intramusculaire ou encore sous forme de spray. 

25 D'autres caracteristiques et avantages de 

1 ' invention sont donnes dans les exemples qui suivent 
afin d'illustrer celle-ci sans toutefois en limiter sa 
portee. 

Dans ces exemples, il sera fait reference aux 
30 figures 1 a 11 qui representent respectivement 

- les figures 1A 7 IB, 1C, ID, IE, IF et 1G 1 ' analyse de 
la banque soustractive rsp5091, 

la figure 2, la distribution de sequences Nm- 
specifiques par rapport a Ng sur le chromosome de la 
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souche Z2491, (partie gauche) et de sequences Nm 
specif iques par rapport a Nl (partie droite), 

- la figure 3A a 3C, la reactivite des clones des 3 
regions du chromosome, selon 1* invention, envers une 

5 panel de souches du genre Neisseria , 

la figure 4, la position, dans la region 2 du 
chromosome de Nm, d 1 oligonucleotides utilises conune 
sondes, 

- les figures 5, 6 et 7, les Southern blots d 1 un panel de 
10 souches du genre Neisseria, en utilisant des parties de 

la region 2 de Nm conune sondes, 

- les figures 8 A a 8C, les Southern blots avec 3 banques 
soustractives sur un panel de 12 souches de Neisseria, et 

- les figures 9, 10 et 11, la reactivite de clones des 3 
15 banques soustractives vis-a-vis de Nm, Nl et Ng. 

Dans les exemples qui vont suivre, les materiels et 
rnethodes suivants ont ete utilises : 

Souches bacteriennes - Pour la realisation des banques 
soustractives, on a utilise la souche Z2491 de Nm 

20 (Achtman et al . , 1991, J. Infect. Dls. 164, 375-382) les 
souches MS11 (Swanson et al., 1974, Infect. Immun. 10, 
633-644), et les souches 8064 et 9764 de Nl, etant 
entendu que tout autre souche de 1 ' espece consideree 
pourrait etre utilisee. 

25 Afin de verifier la specif icite de ces banques, 6 

souches de Nm, 4 souches de Ng, une souche de Nl 
(Neisseria lactamlca) et une souche de Nc (Neisseria 
clnerea) ont ete utilisees. 

Les six souches de Nm sont : Nm Z2491 de serogroupe 

30 A, Nm 8013 de serogroupe C ( XN collection), Nm 1121 non 
serogroupable ( XN collection), Nm 1912 serogroupe A ( XN 
collection), Nm7972 de serogroupe A ( XN collection) et Nm 
8216 de serogroupe B ( XN collection). 

Les quatre souches de Ng sont : Ng MS11 ( Institut 

35 Pasteur, Paris), Ng 403 (Institut Pasteur, Paris), Ng 
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6934 ( Institut Pasteur, Paris), Ng WI ( isolee a partir 
d'une infection gonococcique disseminee), Ng 4C1, Ng 6493 
et Ng FA 1090. 

Les souches de Nl sont Nl 8064 et Nl 9764 ( XN 
collection) et celle de Nc, Nc 32165 ( XN collection). 

Techniques de genetique raoleculaire 

Sauf indication contraire, les techniques et 
reactifs utilises correspondent a ceux recommandes par 
Sambrook et al (Sambrook et al 1989, Molecular Cloning: 
A Laboratory Manual. Cold Spring Harbor Laboratory 
Press ) . Les oligodesoxynucleotides utilises dans cette 
etude sont : 



RBaml2, 3 ' AGTGGCTCCTAG 54 ( SEQ ID N * 54 ) 

RBam24 / 5' AGCACTCTCCAGCCTCTCACCGAG 3'; (SEQ ID N'55) 
Jbaml2, 3 f GATCCGTTCATG 5'; (SEQ ID N*60) 
JBAM24, 5 1 ACCGACGTCGACTATCCATGAACG 3'; (SEQ ID N*61) 
REcol2, AGTGGCTCTTAA; (SEQ ID N'56) 

REco24, 5' AGCACTCTCCAGCCTCTCACCGAG 3'; (« RBam 24) 
JEcol2, GTACTTGCTTAA; (SEQ ID N # 62) 

JEco24, 5' ACCGACGTCGACTATCCATGAACG 3'; (= JBam24 ) 

NEcol2, AATTCTCCCTCG; (SEQ ID N # 64) 

NEco24, AGGCAACTGTGCT ATCCGAGGGAG ; (SEQ ID N'65). 



Transferts sur membranes (Southern blots) 
Les transferts sur membranes ont ete realises par 
transferts capillaires sur des membranes en nylon 
chargees positivement ( Boehringer Mannheim). Les 
hybridations ont ete realisees a 65 *C dans une solution 
comprenant NaPi 0,5M pH7,2/EDTA ImM/SDS 7%/ BSA 1%. Les 
lavages des membranes ont ete realisees dans une 
solution comprenant NaPi 40mM pH7,2/EDTA ImM/SDS 1%. Le 
lavage final a ete realise a 65'C pendant 5 min. 

La sonde frp, obtenue avec des oligonucleotides 
bases sur la sequence de frpA correspond a 2,4 kb de 
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l'extremite 5' du gene de la souche Z2491. Les sondes 
opc et rotamase correspondant aux genes entiers sont 
produites a partir de la souche Z2491 en utilisant des 
oligonucleotides realises sur la base de sequences 
publiees. Les sondes pllCl et ppk (polyphosphate kinase) 
correspondent aux inserts des plasmides pJLl et 
pBluePPK6001 , respectivement . 

E^eMPle I : Rea l isation de banoues d * ADN present. 
Nm et absents rhez No. 

a. Banque "Mbol" 

Realisation - L'ADN de Nm Z2491 a ete clive par 
1 ' endonuclease Mbol et soumis a deux iterations d'une 
methode, appelee ci-apres CDA (Comprehensive Difference 
Analysis). Cette methode comprend une hybridation 
soustractive en presence d'un exces d 1 ADN cisaille de Ng 
MS11 et une amplification par PCR de celles des sequences 
meningococciques qui, etant absentes de ou ne presentant 
pas d'homologie significative avec 1 ' ADN de Ng MS11, 
pouvaient se re-anneler. 

L'ADN chromosomique de la souche Ng MS11 est 
cisaille de maniere aleatoire par passages repetes a 
travers une seringue hypodermique jusqu'a obtention de 
fragments dont la taille s'echelonne de 3 a 10 kb. Ces 
fragments d ' ADN sont purifies par extraction phenolique. 

L'ADN chromosomique de la souche Nm Z2491 est, quant 
a lui, clive par 1 1 endonuclease de restriction Mbol. Ces 
fragments d'ADN (20 yg) sont ligatures a 10 nmoles des 
oligonucleotides anneles RBaml2 et RBam24. Les amorces en 
exces sont eliminees par electrophorese sur un gel 
d' agarose a 2% a bas point de fusion. La partie du gel 
contenant des fragments amplifies de taille superieure a 
200 pb est excisee et digeree par la p-agarase. Ces 
fragments sont purifies par extraction phenolique. 
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Afin de realiser une hybridation soustractive 
(premiere iteration), 0,2 pg d'ADN Nm, ligature aux 
oligonucleotides RBam, est melange a 40 \ig d'ADN Ng dans 
un volume total de 8 ml d ' un tampon EE 3X ( un tampon EE 
5 IX est compose de N- ( 2-hydroxyethyl ) piperazine-N f - ( acide 
sulphonique propane 3) 10 rtiM et d'EDTA 1 mM, son pH est 
de 8.0)- Cette solution est recouverte d T huile minerale 
et I'ADN est denature par chauffage a 100 *C pendant 2 
min. 2 jjl de NaCl 5M sont ajoutes et on laisse le melange 
10 s ' hybrider a 55 *C pendant 48h. Le melange reactionnel est 
dilue a 1/10 dans une solution prechauffee composee de 
NaCl et de tampon EE, puis immediatement place sur de la 
glace . 

10 \il de cette dilution sont ajoutes a 400 \il de 
15 melange reactionnel pour PCR (Tris.HCl pH9.0 lOmM; KC1 50 
mM; MgCl2 1,5 mM; Triton X100 0,1 %; 0,25 mM de chacun 
des quatre desoxynucleotides triphosphate ; Taq 
polymerase 50 unites par ml). Le melange est incube 
pendant 3 min a 70 *c pour completer les extremites des 
20 fragments re-anneles d'ADN meningococciques . 

Apres denaturation a 94 *C pendant 5 min et addition 
de 1 f oligonucleotide RBam24 a raison de 0,1 nmole par 100 
Vil, les hydridations sont amplifiees par PCR (30 cycles 
de 1 min a 94 # C, 1 min a 70*C et 3 min a 72 # C suivis par 
25 1 min a 94 # C et 10 min a 72 *C; Perkin-Elmer GeneAmp 
9600) . 

Les fragments meningococciques amplifies sont 
separes sur gel des amorces et des ADN gonococciques de 
hauts poids moleculaires . lis sont digeres par Mbol et de 
30 nouveaux oligonucleotides JBaml2 et JBam24 leur sont 
ligatures, Ces ADN ligatures sont a nouveau purifies sur 
gel et extraits au phenol. 

Une seconde iteration d ' hybridation soustractive est 
realisee sur 40 jag d'ADN Ng cisaille de maniere aleatoire 
3 5 et 25 ng d'ADN ligature aux oligonucleotides JBam tel 
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qu'obtenu a 1 1 issue de la premiere iteration 
d ' hybridation soustractive. Lors de cette seconde 
iteration, 1 • amplification de 1 1 ADN Nm auto-annele est 
realisee a 1 1 aide de 1 ' oligonucleotide Jbam24. 

Specificite - Afin de confirmer leur Nm- 
specificite, les sequences amplifliees apres la seconde 
iteration de la methode CDA sont marquees et utilisees 
comme sonde pour de 1 1 ADN digere par Clal issu d r un panel 
de six souches de Neisseria meningitidis, quatre de 
Neisseria gonorrhoeae, une de Neisseria lactamica et une 
de Neisseria clnerea. 

Les Southern blots realises montrent que les 
sequences amplifliees a 1 1 issue de la seconde iteration 
de la methode CDA presentent une forte reactivite avec de 
nombreuses bandes correspondant aux meningocoques et ne 
presentent pas de reactivite avec les bandes 
correspondant aux souches Ng, Nl, Nc. 

La banque "Mbol" apparait done comme Nm- specif ique. 
Exhaustivite - Afin de tester 1 * exhaustivite de la 
banque, 1 1 ensemble des produits issus de la premiere et 
de la seconde iterations de la methode CDA ainsi que les 
materiaux chromosomiques initiaux de Nm Z2481 et de Ng 
MS11 sont soumis a electrophorese sur gel d* agarose, 
trans feres sur membrane et mis en contact avec des sondes 
comprenant des genes connus pour etre meningococcus - 
specifiques, a savoir frp, opc, rotamase (Southern blot). 

II resulte de ces hybridations que le gene Nm- 
specifique frp est represents dans la banque Mbol par un 
fragment de 600 pb, mais qu 1 aucune activite n'est 
observee pour les genes rotamase et opc. La banque M6oI, 
bien que Nm-specif ique, ne peut done etre consideree 
comme exhaustive. 

Etant donne leur haute specificite, les fragments 
issus de la seconde iteration de la methode CDA pour la 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



WO 98/02547 n s PCT7FR97/01295 



banque Mbol peuvent neanmoins etre clones sur le site 
BamHl du plasmide pBluescript. 

Une sequence correspondant a un quelconque des genes 
Nm-specif iques ne peut etre incluse dans la banque 
5 soustractive que si elle est portee par un fragment de 
restriction de taille appropriee. Cette condition est 
fonction de deux facteurs. Premierement, la probability 
pour que les plus grands fragments soient entierement Nm- 
specif iques est faible. Deuxiemement, meme si de tels 

10 fragments existaient, ils seraient sous-representes dans 
la banque du fait des limitations de la technique PCR 
dont l'efficacite d ! amplification diminue avec 
1 ' augmentation de la taille des fragments. Les fragments 
de taille superieure a environ 600 pb ne sont pas inclus 

15 dans la banque. Du fait de l'abscence, dans le chromosome 
de Nm Z2491, de fragments Mbo de taille appropriee, les 
genes rotamase et opc ne peuvent etre inclus dans la 
banque, Une enzyme quelconque ne peut a elle seule 
produire un petit fragment correspondant a un gene Nm- 

20 specif ique quelconque. Une deuxieme banque a done ete 
realisee en utilisant une autre enzyme de restriction 
avec une specif icite differente : Tsp509 . 

b. Banque "Tsp509l" 
25 Realisation - L ' enzyme Tsp5091 presente 1 ' avantage 

de produire des fragments de plus petite taille 
( inf erieure a 1 kb environ ) que 1 f enzyme Mbol . 

Tsp509I reconnait la sequence AATT et laisse, en 
saillie en 5', une sequence de 4 bases compatible avec 
30 EcoRI. Les oligonucleotides utilises sont Reco, Jeco et 
NEco . 

La methode suivie est conforme a celle suivie pour 
la realisation de la banque "Miol" decrite ci-dessus. De 
plus fortes quantites d 1 ADN meningococciques ont 
35 cependant ete utilisees pour la premiere iteration 
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d 1 hybridation soustractive afin de compenser le plus 
grand nombre de fragments de faibles poids moleculaires 
produits par Tsp509l. Pour la premiere iteration, 400 ng 
de fragments d'ADN Nm et, dans la seconde, 25 ng de 
5 fragments Nm sont soumis a hybridation soustractive avec 
40 \ig d'ADN Ng cisaille de maniere aleatoire. 

Pour la realisation de cette banque M Tsp509l" , a 
titre de controle, une troisieme iteration d 1 hybridation 
soustractive est realisee en utilisant 40 jjg d'ADN Ng 

10 cisaille et 0,2 ng de fragments Nm resultant d'une 
digestion par Tsp509I et d'une re-ligature aux 
adaptateurs NEco des fragments obtenus a 1* issue de la 
seconde iteration . 

Specificite - Comme decrit pour la banque 

15 precedente, le produit issu de la deuxieme iteration de 
la methode CDA est marque et utilise comme sonde pour un 
panel de souches de Neisseria . 

La figure 1A illustre 1 ' hybridation Southern blot 
des produits de la seconde iteration de la methode CDA 

20 avec I'ADN digere par Clal de : Nm en piste a, de Ng MS11 
en piste b, de Nm 8013 en piste c, de Ng 403 en piste d, 
de Nm 1121 en piste e, de Ng 6934 en piste f, de Nm 1912 
en piste g, de Ng WI ( souche DGI ) en piste h, de Nm 7972 
en piste i, de Nl 8064 en piste j, de Nc 32165 en piste 

25 k, de Nm 8216 en piste 1. 

Contrairement a la forte reactivite observee avec 
toutes les souches Nm, une faible, ou aucune reactivite, 
est observee avec les souches Ng, Nl et Nc. 

La specifit6 de la banque a 6te etudiee plus avant 

30 en faisant reagir des transferts sur membrane (Southern 
blots) des produits issus de chacune des trois iterations 
de la methode CDA avec des sondes correspondant a pilCl 
et ppk. Ces deux genes sont communs a Nm et Ng. 

La figure IB represente un gel d' agarose apres 

35 electrophorese des chromosomes de Nm Z2491 et Ng Msll, 
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digeres avec Tsp509 et des produits issus de chacune des 
iterations de la methode CDA . 

En piste a, a ete depose 1 pg du chromosome de Nm, 
en piste b 1 pg de ceiui de Ng, en piste c 0,15 pg des 
5 produits issus de la premiere iteration CDA, en piste d 
0,1 pg de ceux de la seconde iteration, en piste e 0,05 
pg de la troisieme iteration, MW representant les 
marqueurs de taille moleculaire. 

Les figures 1C et ID representent des gels realises 
10 comme decrits en figure IB apres transfert sur membrane 
(Southern blots) et hybridation avec pilCl (figure 1C) et 
ppk (figure ID). 

A 1 ' issue de la seconde interation de la methode 
CDA, les sequences correspondant aux genes pllCl et ppk 
15 sont completement exclues de la banque. 

Exhaustivite - L ' exhaustivite de la banque a ete 
examinee en faisant reagir les produits issus de 
1 1 hybridation soustractive avec des sondes correspondant 
a trois genes Nm-specif iques (frp, rotamase et opc). 
20 Ces sondes Nm-specif iques reagissent avec les 

produits d 1 amplification issus de la premiere et de la 
seconde iteration d ' hybridation soustractive. 

Les figures IE, IF et 1G representent des gels 
realises comme decrits en figure IB apres transfert sur 
25 membrane ( Southern blots ) et hybridation avec -frpA 
(figure IE), rotamase (figure IF) et opc (figure 1G). 

Une troisieme iteration d 1 hybridation soustractive 
conduit cependant a la perte de sequences Nm-specif iques 
car les fragments reagissant avec les genes rotamase et 
30 opc sont absents de cette troisieme iteration. 

En considerant 1 1 ensemble de ces donnees, il resulte 
que les produits issus de la seconde iteration de la 
methode CDA sont Nm-specif iques et constituent egalement 
une banque exhaustive des sequences Nm-specif iques . 
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Les produits issus de cette deuxieme iteration sont 
clones au niveau du site EcoRI du plasmide pBluescript. 

La banque produite par Tsp509l est plus exhautive 
que la banque produite par Mbol , comme les 
considerations theoriques basees sur la production 
enzymatique de plus petits fragments de restriction le 
supposaient . 

Selon cet aspect, il faut aussi noter que la banque 
Tsp509l est moins redondante que la banque Mbol c'est-a- 
dire qu'elle comprend moins de duplication de clones. 
86% des clones de la banque Tsp509l correspondent a des 
sequences distinctes alors que seulement 43% des clones 
correspondent a des sequences distinctes dans la banque 
Miol (donnees non presentees). 

La banque produite par Tsp509l constitue done une 
source de clones Nm-specif iques . 

Exemple 3 ; Analyse des clones des h^.P. so^tr^Huo. 

Clonage et seguencage des ADN Nm-specif iques 
Les ADN des banques soustractives sont clones au 
niveau du site BamHl (banque Mbol ) ou EcoRI (banque 
Tsp509I) du plasmide pBluescript, puis transforn.es dans 
DH5a de E. coli. Les inserts sont amplifies par PCR 
realisee sur les colonies transformees en utilisant les 
amorces M13-50 et M13-40, cette derniere amorce etant 
biotinylee a son extremite 5 ' . 

Le sequencage a ete realise sur chaque produit PCR 
apres separation des brins biotinyles et non-biotinyles 
en utilisant le systeme Dynabeads M-280 a streptavidine 
(Dynal, Oslo). Les sequences sont criblees selon leurs 
homologies avec des sequences precedemment publiees en 
utilisant les programmes inf ormatiques Blastn et Blastx 
(NCBI, USA et Fasta) . 
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Les produits PCR issus des colonies de bacteries 
transf ormees , apres utilisation des amorces M13-40 et 
M13-50 comme decrit ci-dessus, ont ete marques par 

3 2 

incorporation avec amorgage aleatoire de a - P-dCTP et 
ont ete utilises comme sonde pour les transferts sur 
membrane de 1 ' ADN chromosomique digere par Clal des 
souches Nm Z2491 et Ng MS11, comme decrit ci-dessus afin 
de verifier leur specificite. 

Cartographie des clones sur le chromosome de la 
souche Nm Z2491. 

On rapporte les resultats des etudes effectuees avec 
17 clones de la banque "Mbol" (designes par la lettre B) 
et 16 clones de la banque "Tsp5091 M (designes par la 
lettre E ) , chacun de ces clones presentant une sequence 
unique et sans contrepartie chez Ng. 

Les positions des sequences d 1 ADN correspondant aux 
produits Nm-specif iques clones ont ete determinees par 
rapport a la carte publiee du chromosome de Nm Z2491 
(Dempsey et al . 1995, J. Bacteriol. 177 . 6390-6400) et a 
1 ' aide de transferts sur membranes (Southern blots) de 
gels d ' agarose ayant ete soumis a electrophorese a champ 
pulse (PFGE). 

Les clones Nm-specif iques sont utilises comme sondes 
pour une hybridation sur membranes ( Southern blots ) de 
1 'ADN de Nm Z2491 digere avec des enzymes a rares sites 
de coupure, a savoir Pad, Pmel, Sgfl, Bglll, Spel Nhel 
que Sgfl. 

Les gels (20 x 20 cm) etaient des gels a 1% 
d* agarose dans un tampon TBE 0,5X et ont ete soumis a 
electrophorese a 6 V/cm pendant 36 heures selon des 
periodes de pulsation variant de maniere lineaire entre 
5 et 35 secondes . 

Les hybridations sur membrane ( Southern blots ) ont 
ete realises comme decrit precedemment . 
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Les resultats obtenus sont rapportes sur la figure 
2 : la reactivate a ete localisee par comparaison avec 
les positions des fragments de taille correspondante sur 
la carte publiee. Les positions de 1' ensemble des 
marqueurs genetiques cartographies par Dempsey et al 
(precedemment cite) sont visualisees a l'aide de points 
sur la carte lineaire chromosomique . Les genes Nm- 
specif iques precedemment divulgues sont marques d'un 
asterisque. Les deux loci appeles "frp" correspondent aux 
genes frpA et frpC. Les locis "pile" correspondent aux 
genes pllCl et pllC2 qui sont des paires de genes 
homologues et qui ne sont pas distingues sur la carte. La 
precision des positions des clones Nm-specif iques de 
1 * invention depend des chevauchements des fragments de 
restriction reactifs. En rnoyenne, la position est de +/- 
20 kb. 

Cette cartographie revele une distribution non 
aleatoire des sequences Nm-specif iques . La majority des 
sequences Nm-specif iques appartiennent a trois groupes 
distincts. Un de ces groupes (region 1) correspond a la 
position de genes relatifs a la capsule precedemment 
decrits . 

On distingue : 

- E109, E138, B230 et B323 comme etant la region 1, 

- B322, B220, B108, B132, B233, B328, E139, E145 et 
B101 comme etant la region 2, et 

- B306, E114, E115, E124, E146, E120, E107, E137 et 
E142 comme etant la region 3. 

63% des sequences identifiees comme specifiques des 
meningocoques sont localisees a 1 ' interieur de ces trois 
regions distinctes . 

Ce regroupement contraste avec la distribution de 
genes Nm-specif iques precedemment divulgues (frpA, frpC 
porA, opc et la region relative a la capsule). 
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Cet art anterieur suggerait en effet que les genes 
Nm-specif iques etaient a 1' exception des genes 
f onctionneilement relatifs a la capsule, disperses le 
long du chromosome. 

La cartographie des sequences Nm-specif iques sur le 
chromosome conduit a un resultat inattendu en regard de 
I'art anterieur. 

La majorite des differences genetiques entre les 
souches meningoccale et gonococcale testees sont 
regroupees en trois regions distinctes. 

La region 1 regroupe des genes relatifs a la capsule 
des meningococci. 

La fonction des genes des autres regions n'est pas 
connue mais des homologies avec des sequences publiees 
15 (tableau 1) suggerent des similarites entre certains 
genes de la region 3 et les proteines transposases et de 
regulation de bacteriophages. Aucun virus meningococcal 
n*a ete caracterise et il est tentant d'imaginer que ces 
sequences soient d'origine phagique. De maniere 
20 interessante, le genome de H. Influenzae contient 
egalement une sequence homologue a celle de la proteine 
de regulation Ner du phage Mu mais on ne sait pas s'il 
s'agit d'un gene fonctionnel. 

Le clone B208 presente une forte homologie (48% 
d'identite, 91% d 1 homologie pour 33 acides amines) avec 
un clone des regions conservees (domaine III) dans la 
classe des proteines qui se lient aux siderophores 
ferriques TonB-dependants . 

La proximite de ce clone avec les genes Nm- 
specif iques porA et les genes regules par le fer frp, et 
en particuiier la possibility qu'il s f agisse d'une 
proteine recepteur Nm-specif ique exposee sur la membrane 
externe font de lui un bon candidat pour de plus amples 
recherches . 
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Le clone B339 correspond a la sequence d 1 insertion 
Nm-specif ique ISI206 . 

La faible homologie entre le clone B134 et la 
sequence d' insertion d' Aeromonas , ainsi que la presence 
en copies multiples du clone B134 parmi des souches 
variees de Nm, suggerent qu ! il pourrait representer un 
nouveau type de sequence d' insertion Nm-specif ique . 

La possibility pour que les regions contenant les 
clones Nm-specif iques puissent correspondre a des ilots 
de pathogenicity conune precedemment decrit pour E. coll 
et Y. pestls est d'un interet particulier. 

Les clones isoles dans cette invention vont 
permettre de mieux comprendre la pertinence des regions 
Nm-specif iques en permettant le clonage et le sequengage 
de fragments chromosomiques plus grands et directement 
par leur utilisation pour des mutations de loci. 

Enfin, la detection des genes meningococcus - 
specif iques, eventuellement impliques dans la 
pathogenicity de 1 ' organisme , permet de cibler des 
antigenes appropries utilisables dans un vaccin anti- 
meningococcique . 

L'efficacite et la rapidite de la methode selon 
1* invention permettent son utilisation dans un grand 
nombre de situations pour lesquelles les differences 
genetiques responsables d*un phenotype particulier a un 
de 2 pathogenes proches sont recherchees. 

Etude de la reactivite des clones des regions 1, 2 et 3 
vis-a-vis d f un panel de souches de Neisseria 

Les produits PCR correspondant aux inserts de chacun 
des clones ont ete rassembles et utilises conune sondes 
d ' hybridation sur membranes (Southern blots) pour un 
panel de souches de Nm, de Ng, de Nl et de Nc. 

Les regions 1 et 2 produisent un nombre limite de 
bandes pour chacun des meningocoques. Cela suggere que 
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ces regions sont a la fois Nm-specif iques et communes a 
tous les meningocoques. 

La figure 3 illustre la reactivite des clones des 
regions 1, 2 et 3 envers un panel de souches 
5 neisseriales . Les clones des regions 1 (figure 3A), 2 
(figure 3B) et 3 (figure 3C) pris ensemble ont ete 
utilises comme sondes envers un panel de meningococci, 
gonococci et envers une souche de Nl et de Nc . 

Les pistes sont les suivantes : ADN de Nm Z2491 en 

10 piste a, de Ng MS11 en piste b, de Nm 8013, en piste c, 
de Ng 403 en piste d, de Nm 1121 en piste e, de Ng 6934 
en piste f, de Nm 1912 en piste g, de Ng wi (souche DGI ) 
en piste h, de Nm 7972 en piste i, de Nl 8064 en piste j, 
de Nc 32165 en piste k, de Nm 8216 en piste 1. 

15 De maniere remarquable, la region 3 ne presente de 

reactivite qu 1 avec les meningococci de serogroupe A. 
Cette region 3 est done specif ique d ' un sous-groupe de 
Nm. 

Une comparaison avec des sequences connues dans les 
20 banques de donnees a ete realisee afin d'evaluer les 
possibles fonctions des regions donees . 

Le tableau 1 qui suit donne les positions des clones 
specifiques sur la carte chromosomique et les homologies 
avec des sequences connues. 
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On peut voir, tout d'abord, que les clones de la 
region 1 correspondent tous aux genes impliques dans la 
biosynthese de la capsule. Ces genes ont ete precedemment 
etudies parmi les Nm de serogroupe B ( Frosch et al. 198.9, 

5 Proc. Natl, Acad. Sci . USA 1669-1673 et Frosch et 

Muller 1993, Mol. Microbiol, a 483-493). 

A 1' exception d'une faible homologie avec 
1 ' activateur de hemolysine de Serratia marcescens , les 
clones de la region 2 ne presentent aucune homologie 

0 significative avec les sequences publiees, que ce soit au 
niveau de 1 1 ADN ou des proteines. 

Deux des clones de la region 3 presentent 
d ' interessantes homologies avec des proteines qui se 
lient a 1 ' ADN, en particulier les proteines de regulation 

^ et les proteines transposases de bacteriophages. 

Le clone B208 presente une forte homologie avec une 
des regions conservees dans une classe de rfecepteurs 
( siderophore f errique TonB-dependant ) . 

Les clones B134 et B339 s ' hybrident avec de 

0 nombreuses regions du chromosome ( au moins 5 et au moins 
8 , respectivement ) . 

Les donnees concernant les sequences montrent que le 
clone B339 correspond a la sequence d* insertion Nm- 
specifique S1106. 

5 La traduction du clone B143 presente une homologie 

limitee avec la transposase d'une sequence d ' insertion 
Aeromonas ( SRS2 ) ( Gustaf son et al. 1994, j. Mol. Biol. 
221, 452-463). Nous avons pu demontrer par transfert sur 
membrane (Southern blots) que ce clone est une entite Nm- 

3 specifique presente en multiples copies dans les 
chromosomes de chaque meningocoque du panel teste. 

Les autres clones ne presentent pas d ' homologie 
significative avec les sequences neisseriales publiees ni 
d'ailleurs avec aucune sequence publiee. Ces clones 

5 constituent done, avec la majorite des autres clones 
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isoles, une banque de loci Nm-specif iques totalement 
nouveaux . 

Fxfimnle 3 : Etude de la region 2 du chromos ome fle Nm 

5 

. Determination et caracterisation de la sequence de 
la region 2 

On procede a une amplification par PCR avec de 1 ' ADN 
chromosomique de la souche Z2491 de serogroupe A, sous- 
10 groupe IV-1, en utilisant des amorces d 1 oligonucleotides 
elaborees a partir de chacune des sequences de clones de 
la region 2, selon de nombreuses combinaisons 
differentes. On sequence les produits de la PCR qui se 
chevauchent a partir des 2 brins en utilisant la 
15 technique de terminaison de chaine et le sequenqrage 
automatise (ABI 373 ou 377). 

Pour prolonger la sequence au-dela des limites des 
clones disponibles, on clone des fragments partiels 
SauIIIA de 15 kb, de la souche 22491, dans Lambda DASH- 
20 II ( Stratagene ) . 

On identifie les phages contenant les inserts 
chevauchant la region 2 par hybridation avec comme sondes 
des clones de cette region. L'ADN insere est sequence a 
partir des extremites des inserts et ces sequences sont 
25 utilisees pour elaborer de nouvelles amorces qui 
serviront a amplifier directement 1 ' ADN chromosomique et 
non l'ADN phagique. 

On obtient une amplification de 1 r ADN chromosomique 
en utilisant ces nouvelles amorces et celles de la 
30 sequence precedemment disponible. 

Ces produits PCR sont egalement sequences a partir 
des 2 brins , ce qui conduit a une sequence complete de 
15620 pb (SEQ ID N*36). On analyse les cadres de lecture 
de cette sequence qui commencent par ATG ou GTG et qui 
35 sont caracterises par un indice d f usage de codons eleves . 
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Cette analyse reveie 7 COLs de ce type qui remplissent la plus grande partie de la 
sequence de I5620pb. Les positions de ces COLs sont les suivantes: 
COL-1: 1330 a 2970 (SEQ ID N°37); COL-2: 3083 a 9025 (SEQ ID N°38); COL-3: 
9044 a 9472 (SEQ ID N°39); COL-4: 10127 a 12118 (SEQ ED N°40); COL-5: 12118 a 
5 12603 (SEQ ID N°41); COL-6: 12794 a 13063 (SEQ ID N°43); COL-7: 13297 a 14235 
(SEQ ID N°44); et COL-8: 14241 a 15173 (SEQ ID N°45). 

Le COL-4 commence avec le codon GTG et chevauche un COL legerement plus 
petit (SEQ ED N°41) dans le meme cadre de lecture (9620-12118, cadre 2) et qui 
commence par le codon ATG. 
^0 COL-4 code pour une proteine qui presente des homologies structurelles avec 

une famille de polypeptides comprenant les pyocines {Pseudomonas aeruginosa), 
collcines et intimines (Escherichia coli) qui sont des toxines bactericides (pyocines, 
collcines) ou des proteines de surfaces impliquees dans Tadhesion des bacteries aux 
proteines eucaiyotes. Le COL-7 encode une proteine dont la sequence contient une 
15 region potentiellement transmembranaire, et qui presente des homologies structurelles 
avec des proteines periplasmiques ou inserees dans la membrane externe des bacteries. 
Les homologies structurelles de COL-4 et COL-7 ont ete identifies a l'aide du 
programme Prop Search. 

La recherche de sequences homologues aux autres COL dans GenBank a l'aide 
20 du programme BLAST a reveie une homologie entre les regions N-terminales de COL-2 
et rhemagghitinine filamenteuse B de Bordetella pertussis (43% de similarity 36% 
d'identite sur 352 acides amines) et entre COL-1 et la proteine fhaCde Bordetella 
pertussis (35% de similarity 27% d'identite sur 401 acides amines). COL-1 et COL-2 
sont des genes voisins dans la souche Z2491 et rhemagghitinine filamenteuse B de 
25 Bordetella pertussis et fliaC sont des genes voisins dans Bordetella pertussis, ce qui 
renforce la probability que ces homologies refletent des homologies fonctionnelles. 
Confirmation de la specificite de la region 2 vis-a-vis de Nm 
On effectue des Southern blots en utilisant des sondes d'ADN obtenues par 
amplification par PCR de differemes parties de la region 2 en utilisant des amorces 
30 oligonucleotidiques elaborees a partir de sequences de clones de la region 2. 

On a represents sur la figure 4 la position approximative de ces oligonucleotides. 
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II s'agit, dans une moitie de COL-1, des 
oligonucleotides appeles R2001 ( SEQ ID N * 46 ) et R2002 
( SEQ ID N # 47), dans une moitie de COL-l+la majeure partie 
de COL-2, des oligonucleotides b332a (SEQ ID N - 48), el39a 
5 (SEQ ID N # 49), bl32a (SEQ ID N # 50) et b233b (SEQ ID 
N'51), et dans 1/3 de COL-4+ COL-5 a 7, des 
oligonucleotides el45a (SEQ ID N # 52) et blOla (SEQID 
N"53 ) . 

Les trois Southerns sont realises dans les 

10 conditions d 1 hybridation suivantes: 
16 h a 65*C, 
NaP0 4 pH 7,2 

EDTA-Na 0, 001M 

1% de dodecylsulf ate de sodium. 

15 

Pour le lavage, on chauffe 10 min a 65 # C et on 
utilise NaP0 4 0,5M, pH 7,2; EDTA-Na 0,001M, 1% de 
dodecylsulf ate de sodium - 

Les figures 5,6 et 7 representent respectivement 
20 les Southern blots obtenus avec chacune des parties de 
COL mentionnees plus haut, 

Les 14 pistes correspondent respectivement, dans 
chacun des Southerns, a 
1: MS11 (Ng) 
25 2: 403 (Ng) 

3: FA1090 ( Ng ) 
4: Wl (Ng) 
5: 6493 (Ng) 

6 : marqueur ( lambda hindlll ) 
30 7: Z2491 (Nm, gpA ) 

8: 7972 ( Nm gpA ) 

9: 8013 (Nm, gpC ) 

10: 1121 ( Nm non groupable ) 

11: 1912 (Nm, gpB ) 
35 13: 32165 ( Nc ) 
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14; 8064 ( Nl ) . 

Etant donne qu ' un panel de souches de Neisseria est 
utilise dans ces experiences et que chaque puits est 
5 charge avec une quantite similaire d'ADN digere, ces 3 
Southerns blots montrent clairement que les sequences 
correspondant a la region 2 sont trouvees dans tous les 
meningoccoques testes et qu ' il n'existe pas dans le 
genome de Ng des souches testees de sequences homologues 
10 signif icatives . 

ExQgiple — 4j_ Identification de regions du genome Nm 
absentes de Nl et communes avec Ng 

15 0n opere selon la technique decrite dans 1 ' exemple 

1, mais on utilise l'ADN chromosomique d'une souche de Nm 
(Z2491) et de 2 souches de Nl (collection XN) dont on 
melange les ADN a parts egales. 

On efffectue 2 soustractions en utilisant les series 

20 d: amorces R et J. Trois banques differentes sont ainsi 
realisees . 

Deux banques, appelees Bam et Eco, sont 
respectivement obtenues par digestion de I'ADN 
chromosomique de Nm Z2491 par Mbol et Tsp5091; une 
troisieme banque, appelee Cla, qui resulte de la 
digestion de 1 1 ADN chromosomique de Nm par MspJ, est 
obtenue en utilisant le jeu d ! amorces RMsplO, RMsp24, 
JMsplO et JMsp24. L' ensemble des amorces utilisees est 
donne dans le tableau 2 suivant. 



25 
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Tableau 2 



5 Adaptateurs pour banques dif f erentielles 



ADN chromosomique digere par 
10 pBluescript par 



Clonage dans 



15 



Mbol 

Tsp509I 

Mspl 



BamHI 
EcoRI 
Clal 



20 



25 



30 



Premier tour de soustraction 

RBaml2 : 3' AGTGGCTCCTAG 
RBam24 : 5 f AGCACTCTCCAGCCTCTCACCGAG 



5' (SEQ ID N*54) 

3 f (SEQ ID N # 55 ) 



REcol2 : AGTGGCTCTTAA (SEQ ID N'56) 

RBam24 : 5 ' AGCACTCTCCAGCCTCTCACCGAG 3 f (SEQ ID N*55) 

(REco 24 = RBam 24) 

RMsplO : AGTGGCTGGC (SEQ ID N # 57) 

RMsp24 : 5 ' AGCACTCTCCAGCCTCTCACCGAC 3 ' ( SEQ ID N # 58 ) 



35 



40 



45 



Deuxieme tour de soustraction 

Jbaml2 : 3 f GTACTTGCCTAG 5' (SEQ ID N*59) 

JBam24 : 5 r ACCGACGTCGACTATCCATGAACG 3' (SEQ ID N # 60) 

JEcol2 : GTACTTGCTTAA (SEQ ID N'61) 

JBam24 : 5 ' ACCGACGTCGACTATCCATGAACG 3 f (SEQ ID N'60) 

( JEco 24 = JBam 24) 

JMsplO : GTACTTGGGC (SEQ ID N # 62) 

JMsp24 : 5 T ACCGACGTCGACTATCCATGAACC 3 ' ( SEQ ID N # 63) 
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Apres 2 soustractions, on marque la totalite du 
produit de chaque amplification et on 1 'utilise comme 
sonde. 

5 On effectue un controle des banques soustractives 

par Southern blot sur un panel de 12 souches de Neisseria 
( ADN chromosomique coupe par Clal ) . Les conditions 
d 1 hybridation sont identiques a celles donnees dans 
1 ' exemple 1 . 

10 Ces Southern blots sont donnes sur les figures 8A a 

8C, qui sont respectivement relatives a la banque 
MboI/BamHI , a la banque Mspl/Clal et a la banque 
Tsp5091/EcoRI . 

Les 12 pistes correspondent respectivement a : 
15 l: Nm Z2491 ( groupe A) 
2: Nl 8064 

3: Nm 8216 (groupe B) 
4: Nl 9764 

5: Nm 8013 (groupe C) 
20 6: Ng MS11 

7: Nm 1912 (groupe A) 
8: Ng 4C1 

9: Nm 1121 ( non groupable) 
10: Ng FA1090 
25 11: Nc 32165 

12: Nm 7972 (groupe A). 

L'examen des Southern blots montre que les sequences 
contenues dans chaque banque sont specif iques de Nm et ne 
30 sont pas trouvees chez Nl. De plus, la reactivite 
observee avec les souches de Ng suggere que certaines de 
ces sequences sont presentes chez Ng. 

Chacune de ces banques a ensuite ete clonee dans 
pBluescript au site BamHI pour Bam, ou EcoRI pour Eco, ou 
35 Clal pour Cla. Afin de confirmer la specif icite des 
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clones vis-a-vis du genome de Nm, on a procede a une 
restriction des clones individuels et a leur 
radiomarquage. Les clones montrant a la fois une 
reactivite pour Nm et Ng. ont ete conserves pour des 
5 etudes ulterieures. Ces clones sont representes sur les 
figures 9, 10 et 11, qui donnent les profils, vis-a-vis 
de Nm, Nl et Ng, de 5 clones de la banque Bam (figure 9), 
de 16 clones de la banque Eco (figure 10), et de 13 
clones de la banque Cla (figure 11). 
10 Ces clones ont ete sequences en utilisant des 

amorces universelles et inverses. II s ' agit 
des clones Bam 

Bll partiel de 140 pb ( SEQ ID N # 66), B13 partiel estime a 
425 pb (SEQ ID N # 67), B26 de 181 pb (SEQ ID N * 68), B33 

15 de 307 pb (SEQ ID N * 69), B40 de 243 pb (SEQ ID N' 70), 
- des clones Cla 

C16 de 280 pb (SEQ ID N # 72), C20 partiel estime a 365 
pb (SEQ ID N* 73), C24 partiel estime a 645 pb 
(SEQ ID N* 74), C29 partiel estime a 245 pb (SEQ ID 

20 N • 75), C34 de 381pb (SEQ ID N # 76), C40 de 269 pb ( SEQ ID 
N * 77),C42 de 203 pb (SEQ ID N*78),p C43 de 229 pb (SEQ 
ID N* 79), C45 de 206 pb (SEQ ID N* 80),C47 de 224 pb 
(SEQ ID N* 81), C62 de 212 pb (SEQ ID N* 82), et C130 
(5 r ...) estime a 900 pb (SEQ ID N* 83), et 

25 - des clones Eco 

E2 de 308 pb (SEQ ID N # 84), E5 partiel, estime a 170 pb 
(SEQ ID N # 85), E22 partiel estime a 300 pb (SEQ ID 
N * 86), E23 de 273 pb (SEQ ID N # 87), E24 de 271 pb (SEQ 
ID N* 88), E29 de 268 pb (SEQ ID N* 89), E33 partiel, 

30 estime a 275 pb (SEQ ID N*90), E34 partiel, estime a 365 
pb (SEQ ID N* 91), E45 de 260 pb (SEQ ID N* 92), E59 
estimation superieure & 380 pb (SEQ ID N* 93), E78 de 308 
pb (SEQ ID N • 94), E85 de 286 pb (SEQ ID N * 95), E87 de 
238 pb (SEQ ID N* 96), E94 partiel, superieur a 320 pb 
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(SEQ ID N # 97), E103 partiel, superieur a 320 pb ( SEQ ID 
N* 98) et E110 de 217 pb (SEQ ID N # 99). 

La cartographie de chaque clone a ete effectuee sur 
le chromosome de Nm Z2491 en operant comme decrit dans 
1 ' exemple 2. Les resultats obtenus sont donnes sur la 
partie droite de la figure 2. On constate que ces clones 
correspondent aux regions appelees 4 et 5 . Ces regions 
sont done constitutes de sequences presentes a la fois 
chez Nm et chez Ng, mais non trouvees chez Nl. II est 
done considere qu'il s'agit de sequences codant pour des 
facteurs de virulence responsables de la colonisation 
initiale et de la penetration de la muqueuse. La region 4 
est localisee entre argF et regrF sur le chromosome de Nm 
2491 et la region 5 entre le marqueur lambda 375 et penA. 
Cette region contient vraissemblablement des sequences 
codant pour un variant Opa et une proteine liant la 
transf errine . 

Une comparaison avec les sequences connues dans les 
banques de donnees a moitie que dans la region 4 seul le 
clone C130 presente une homologie, a savoir avec Mspl 
methylase. Dans la region 5, aucune homologie avec des 
sequences connues n'a ete trouvee avec les clones C8, E2, 
B40, C45, E23 et E103. Pour les autres clones, les 
homologies sont les suivantes : 

Bll arginine decarboxylase SpeA; C29 arginine 
decarboxylase SpeA; C62 oxoglutarate/malate 

transporteur; repetitive DNA element; E34 element 
repetitif d 1 ADN ; E94 endopeptidase MepA murine ; C47 
citrate synthase PrpC; E78 citrate synthase PrpC 

5*OTPle 5 — i — Mise en evidence de la nr^sencp d'uixo m 

plusieurs — aouches — sis — Feisseria meningitidis dana v « 

echantillon binl nqicme, 

Un echantillon biologique de type liquide cephalo- 
rachidien, urine, sang, salive est preleve. 
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Apres filtration et extraction, les ADN presents 
dans cet echantillon sont soumis a electrophorese sur gei 
et transferes sur membrane par Southern blotting. 

Une sonde nucleotidique constitute par le marquage 
5 au 32 P de la SEQ ID n*5 est incubee avec cette membrane 
de transfert. 

Apres antoradiographie, la presence de bande(s) 
reactive(s) permet de diagnostiquer la presence de 
Neisseria meningitidis dans 1 * echantillon . 

Fvgmp1p> 6 : Composition va ccinale incluant — sifins SQP 

spectre une proph v laxie a visee ant i -meningococci <roe et 
destinee a p revenir toute forme d ' infection Par Neisseria 
meningitidis . 

15 Le peptide code par une sequence incluant la SEQ ID 

n*10 est conjugue a une toxine* 

Ce peptide conjugue est alors ajoute a une 

composition comportant le vaccin anti -Haemophilus et 

anti-pneumocoque, ou tout autre vaccin de 1'enfance. 
20 La composition resultante peut, apres avoir et6 

rendue sterile, etre injectee par voie parenterale, sous- 

cutanee ou intramusculaire • 

Cette meme composition peut egalement etre 

pulverisee au niveau des muqueuses a 1 ' aide d'un spray. 

25 
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LISTE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 



: : i CEPCSANT : 

(A) NCM: I.N.S.E.R.M 

(3) RUE; 101. rue de Tolbiac 

£C) VILLE: PARIS CEEEX 13 

fE) PAYS: FRANCE 

( r ) CODE POSTAL : 75654 



in) TITRE DE L' INVENTION: ADN . proteines et peptides speci:;cues des 
bacterids de i'espece Neisseria meningitidis. Leurs orocedes" c ' cbrenaon ec 
leurs applications biologiques. 

:in) MCMBRE DE SEQUENCES: 99 

(iv) FCRME DE CH I FFRA3LE PAR ORDINATEUR: 
(A) TYPE DE SUPPORT; Floppy disk 
(3) CRDINATEUR: IBM PC compatible 

(C) SYSTEME D ' EXPLOITATION; PC-DOS/MS-DOS 

(D) LCGICIEL: Patentln Release ri . 0 . Version #1.30 (CE3) 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(D CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 7 pa ires de bases 

(3) TYPE: nucleotide 

(C) MCMBRE DE BRINS : simple 

CD) CONFIGURATION : lineaire 

fii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SCUCHE: 22491 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 
GATCCGCTGC CGGCAGACGA ATATCAAGAC ATCTTCGATT TTATGAAACA GTATGACTTG 60 
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TCTTACCCGT ATGAATATCT GCAGGATTGG A TAG ATT ACT ATACGTTCAA AACCGATAAG 120 
CTCGTATTTG GTA A CGCG A A GCGAGAGTGA GCCGTAAAAC TCTGAGCTCC TGTTTTATAG ISO 
ATTACAACTT TAGGCCGTCT TAAAGCTGAA AGATTTTGGA AAGCTATAAA TTGAAGCCCT : ^0 
TCCACAGTAC ATAGATC 2 57 



(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE . 

(A) LONGUEUR: 276 pa ires de bases 

(3J TYPE: nucleotide 

(C) NOMBRE CE ERINS : simple 

(O; CONFIGURATICN : hneaire 

(ii) TYPE EE MOLECULE; ADN (genomique) 

(v:j ORIGINE . 

(A) ORGANISMS : Neisseria meningitidis 
f 3 ) SOU CHE : Z 2 4 9 1 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 2. 



GATCATGTTC AAATAGATAG GCATGGGAAG CTGCAGCTCT AACGTCCATG AAAATATGTT 6 0 

GCATAGCTGC AAGCGGAACG CCTTTTCTTT CATCTACATA ATCTATAGAG TCAAGGCAAC 120 

CGCTATTGAA ATT AG CA GTA TTGCCTATGA TTACATTAGT AATATGCTCA TACCATTTTT 130 

GGGTGGTCAT CATATTGTGC CCCATTGTrA TCTCCTTATA TTGGTTTTAG AAGGAACTTT 2 40 

GACAGGAAGA ATAA CGGCCT TACCTGTTTG ACGATC 27 6 



(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 423 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATICN: lineaire 

(ii) TYPE DE MOLECULE: ADN (gencmique) 



BNSDOCID: <WO 9802547A2 I 



FEUILLE DE REMPLACEMENT (REGIE 2$) 



WO 98/02547 PCT/FR97/01295 

48 

f vi ) CRIGINE: 

(A! ORGANISMS: Neisseria meningitidis 
(3) SCUCHE: Z2 -1 9 1 



::<i) CESCHIPTICN DE LA SEQUENCE: SEQ ID NO: 3 



GAT 



7GTTTCCACA GGTAGGCGCA TACTTGTTCG GGACTGAGTT T3CGGCGGAT 5 0 



428 



AAGGGTGTC3 ATGTGCTGAA TCAGCTGCGA ATCGAGCTTA TAGGGTTGTC GCTTACGCTG 1 20 

TTTGATAGTC CGGCTTTGCC GCTGGGCTTT TTCGGCGCTG TATTGCTGCC CTTGGGTGCG 180 

GTGCCGTCTG ATTTCGCGGC TGATGGTGCT TTTGTGGCGG TTAAGCTGTT TGGCGATTTC 240 

GGTGACGGTG CAGTGGCGGG ACAGGTATTG GATGTGGTAT CGTTCGCCTT GGGTCAGTTG 300 

CGTGTAGCTC ATGGCAATCT TTCTTGCAGG AAAGGCCGTA TGCTACCGCA TACTGGCCTT 3 60 

TTTCTGTTAG GG AAAGTTGC ACT7CAAATG CGAATCCGCC GACCTCTTTC AGTTACAGCA 4 20 
GCTTGATC 

( 2 ) INFORMATIONS POUR LA SEQ ID NO : 4 ; 

(i) CAJtACTZRISTICUES DE LA SEQUENCE: 

(A) LONGUEUR: 390 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: line a ire 

(ii) TYPE DE MOLECULE : AEN (genomique) 

(vi) GRIGINE. 

(A) ORGAN I SME : Neisseria meningitidis 
(3) SCUCHE. Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

GATCCTGCAT TGACATCGGC CTTGGCTGTC AGGGTATTGT GACCGGTAAA GTCGGCATTA 

CCGTTGGCCA ATAAGGATAC ATGACCGTCT GCAGAAACAG CATGAAGGCC GTCTGAAACG 120 

ATATTGCCCT GCAATGCGGT GGTTTCGAGA GCCTTGGCTG CGTTCAGCTT GGTATTGCGA 180 

AGCTGAATAT TGCCTTTGGC TGCCTGAATG TGCAGATTAC CCGAGTTGGT ACGCAGATTG 2 40 



60 
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GTA7TGGTAA CATTCAGCAA GCCTGCCTCG ACACCCATGT CTTTTGAGGC AGTGAGGGTT 3 00 
TTACTGGTGC GGGTAATATG GGGAGCGTTA TCCGATTTCA AATGGATGCT GGGCGGCXGA 3 60 
CAAATC7TTA TCAACATTCA AATTCAGATC 330 
(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(l) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 177 paxres de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineal re 

Ui) TYPE DE MOLECULE: ATN (genomique) 

(vi ) CRIGINE : 

(A) ORGANISME: Neisseria meningitidis 
(3) SOUCHE: Z24 91 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 5: 

GATCAGATTG GTGAAGACGG TATTACCGTC AATGTTGCAG GCCGTTCGGG AT AT A CGGCG 6 0 

AAAATCG A CG TGTCTCCGAG TACCGATTTG GCGGTTTATG GCCATATTGA A GTTGT A CGG 120 

CGTGCXACCG GGTTGACCCA ATCCAATTCA G AG CCGGGTG GAACCGTCAA TTTGATC 177 

(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARA CTER I ST I QUE S DE LA SEQUENCE: 

(A) LONGUEUR: 34 1 paires de bases 

(B) TYPE: nucleotide 

fC) NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineai re 

(ii) TYPE DE MOLECULE: ADN {genomique) 

(vi) CRIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 6: 
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GATCAATGA, G^ACTAiiC AAGCGGGCAG TTCCGTGTAC AGCTCCACCA AAGGCGATAC 



GAATACTCCC GGCAATCTGT ATGTTCATAC AGGTAAAGAT C 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

CD CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 164 paires de bases 

f3) TYPE : nucleotide 

(CJ NCMBRE DE BR INS : simple 

fD) CONFIGURATION: lineaire 

Cii) TYPE DE MOLECULE: ADN (genomique) 

(vi) CRIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SCUCHE: Z24 91 

(xi) DESCRIPTION DE LA SEQUENCE ; SEQ ID NO : 7; 

G ATCCAA CTG TTTGATTTTA CTGGCTGCTT CTCCATGCGC GGTATTGACC AAAGCCGCAA 

GGATATTCGC TTCCAGATTG TCTTTCAGGC TG CCGCCGTT GACAGCGGTA TTAATCAGTG 

CGGCACTGCC C3CATTGGCT A GGTTG A CGG TCAGGTTGTT GATC 

( 2 ) INFORMATIONS POUR LA SEQ ID NO : 8 : 

(i} CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 219 paires de bases 

(3) TYPE: nucleotide 

CO NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 



60 



TGAATTGGGT GAAAATACCC GTATTATTGC TGAAAACGTA ACCGTATTAT CTAACGGTAG 120 
TATTGGCAGT GCTGCTGTAA TTGAGGCTAA AGACACTGCA CACATTGAAT CGGGCAAACC 130 
GCTTTCTTTA GAAACGTCGA CCGTTGC~C CAACATCCGT TTGAACAACG GTAACATTAA 2 40 



AGGCGGAAAG CAGCTTGCTT TACTGGCAGA CG ATA AC ATT ACTGCCAAAA CTACCAATCT 3 



00 



341 



60 



164 
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(A) ORGANISMS: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE . SEQ ID NO: 3: 

GATCAATCAC ACATCTTGTC ATTTTTTCGA TTCCTTCATT TCGGTTTCTA ATGTTTCAAT 6 0 

TCTTGCGGCC ATTTCCTGAA TGGCTTTAGT CAAAACGGGG ATGAACGCTT CGTATTCGAC 1 20 

GGTGTAGGTA TCGTTTGTTT TATTTACCAT CGGCAATCGA CCATATTCAT C7TCCAGCGC 18 0 

AGCAATGTCC TGGGCAATAA ACCAATGCCG CAACCGATC 219 

(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(l) CARACTERISTIQUES DE LA SEQUENCE; 

(A) LONGUEUR: 3 56 pa ires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(iij TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGAN IS ME : Neisseria meningitidis 

(B) SOUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 

GATCTTGGGT AAGCCCCCAA CCTGCATAGA AAGGCAGGCC GTAGCAGCTG ACTTTTTTGC 6 0 

CGCGCAACAA GGCTTCAAAA CCGGTCAGCG AAGTCATGGT ATGTATTTCG TCTGCGTATT 120 

GGAGACAGGT CAGGATGTCG GCTTGTTCGG CGGTTTGGTC GG CATATCGT GCAGCATCAT 130 

CAGGGG AAAT ATGGCCGATG CGGTTACCGC TG ACTA CATC GGGATGCGGT TTGTAGATGA 2 40 

TATAGGCATT GGGGTTTCGT TCGCGTA CGG TACGGAGCAA ATCCAGATTG CGGTAGATTT' 3 00 

GGGGCGAACC GTAGCGGATA GACGCATCAT CTTCAACCTG GCCGGGAACG AGGATC 3 56 

(2} INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 210 paires de bas s 
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(3} TYPE . nucleotide 

fC) NOMBRS DE BR INS : simple 

ID) CONFIGURATION : imeaire 

(li) TYPE DE MOLECULE: ADN (cenomique) 

( vi J CRIGINE ; 

(A) ORGANISME. Neisseria meningitidis 
(3 J SCUCHE: 124 9 1 

(xi) DESCRIPTION DE LA SEQUENCE ■ SEQ ID NO. 10: 
GATCCGCTTT CAGTTTCCGT ACCGGTGGCA TCAGTCAAGT CCGTTTTGTG CACCAAACCG 6 0 
CGTCCATATG AAACATAAAA CAAATCGCTT AAGCCCAAAG GGTTATCGAA C3ATAAAGCG 120 
ACATTTCCrrT GATAT7TGCC GGTCGTTTTG CCGCCCGCAT CATCTATACC GA7ACTGAAC 180 
CGTATGGGTT TATTCTGCTG CCATTTGATC 



(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 9 pa ires de bases 

(B) TYPE: nucleotide 

(C) NCMBRE DE BRINS: simple 

(D) CONFIGURATION: imeaire 



Ui) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SCUCKE: 22491 



210 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
GATCCCG AAA CGCAATTGGT CGAAAGCTAT ATGCTGAACG ATGTGTTGCG GTTTTGGGAC 

AG CG CAGGTT TGGGCGATGG GAAAGAAGCC GACCGCGCCC ATCGGCAAAA ACTGATTGAT 



ATCCTTAAAA TGATTGATC 



60 



120 



GT CCTGTCT A AAACCTATAC TCATTCGGAT GGG C AGTGGG GCTGGATAGA TTTGGTGTTC 180 
GTTATCCTTG ACGGCAGCTC CCGCGATTTG GGTACGGCCT ATGATTTGTT GAGGG ATGTT 24 0 



259 
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(2) INFORMATIONS POUR LA SEQ ID NO : 12: 

(l) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 4 36 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE HRINS : simple 

(D) CCN FIGURATION: Lineal re 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi ) CRIGINE : 

(A) ORGANISME: Neisseria meningitidis 

(B) SCUCHE . 22^91 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

GATCAAATGG ATGATTTATA TAGAATTTTC TTTTACGACT GCGTGCCGTT TGAAAAGAAA 6 0 

ATGCACAATC CCGTATCTCA TCGTGCC AT A GATTTTTCAA AGACTCCGGA AGCCATATTT 120 

CGTTGCAATC TGCATACCGA ATTGAAGAAG AAGCGTAAAT TAGCGTTACG TTTAGGCAAG 130 

CTGTCGGACA ATACAGCATG GATATTAAAA CCCCAAGTCA TGAAAAATCT TCTGAAAAAC 24 0 

CCGTCAACTC AAATTACGGA AAACGATGTC GTGCTCGATG TTAAACAAAA AGGTGTAGAT 30 0 

ATGCGTATAG GCTTGGATAT TTCATCTATT ACCTTAAAAA AACAAGCCGA TAAAATCATC 36 0 

TTGTTTTCTG GTGATTCCGA TTTTGTCCCA GCAGCCAAAT TAG CC AG A CG GGAAGGTATC 4 20 

GATTTTATTC TTGATC 43 6 
(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LCNGUEUR: 363 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(v: ) CRIGINE: 

(A) ORGANISME: N isseria meningitidis 
(3) SOUCHE: 224 91 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ZD NO : 13; 
GA7CGTTTTA CGTCGCAATC G AG CTTTGTG GTGCGCTCGG CTAAAAGCCA ATCTTCTCTC 6 0 
AATGGCCTOG GTGCCATTTT GCAGGGCACA GGTTTTGCZZ GTGCGCAAGA CG ATA TTT A 7 i:o 
ACCGTGCAGG AATATATCCA GTCGCGTTCG GC777GGA7G CGTTGCCTAA GAAAATGCCC 
ATTCGCGATT TTTATGAAAA AGAAGGCGAT ATTTTCAGCC GT7TTAA7GG TTTTGGC~G 
CGTGGCGAGG ATGAGGCGTT 7TATCAATAC TACCGTGATA AGGTATCCAT CCATTTTGAC 
TCTGTCTCAG GCATTTCCAA TTTGAGCGTT ACATCGTTTA ATGCCGGTGA ATCTCAAAAG 
ATC 

363 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 314 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION ; lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

(vi ) ORIGINE: 

(A) ORGANISME : Neisseria meningitidis 
(3) SOUCHE: 22491 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 
GATCTTGCGT CATTTATATC TTCACCGATA TTGCAATTAC CGCCGTTCCA GTTGAAATAA 
CAACGACTAA AATTGTAGTT CCTAAAAGAA TCATTCCTAT TCTTGCGTAC CATTTCCCAA 
TAATTGCGCC CGACAATTTC CATTTAATGC TCCATCAGTT CTTTTACTTC CGGAAATCTG 180 
CTGTAATCTG ACATAAGACG CATAATTGAA CTATCAACGC CGTAACAGCC ATAGGTTTTA 2 40 
ATACCGTTTT CGG CGTGTTC CCAAATGCAA TTACTGTATT CGTAGCCTTT TACAAATTTA 3 00 
TCGGTTTCGG GATC 

314 



60 
120 
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(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

fi) CARACTERISTIQUES DE LA SEQUENCE 

(A) LONGUEUR: 2 56 pa ires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE ERINS. simple 

(D) CONFIGURATION lineal re 

(li) TYPE DE MOLECULE . ADN ( gencmique I 

(vi) ORIGINE : 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2 491 

(xx) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

GATCATACGA ATCTACCC7A AAATACCCCG TCGCCGATTT AGGATTGGCT ACATAAAGCT 6 0 

CATTATAAGG GTATTTTGAT GACATGATAC GGTTAAATTC ATTGCCGTTG TTTATCCTGA 120 

TTCTATAAAT TGGTTCAACA GCAAAGCCTC TGGATTCCCT TAATTGATTA TAATATTGCC 180 



TGTATGTTTG TACATCATGT 



rCCACG GCTCTCCAGG AGTCCTCAGA ATAGCAATCC 240 



CGTTAAATTT CGGATC 



256 



(2) INFORMATIONS POUR LA SEQ ID NO : 16: 

( l ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 235 paires de bases 

(EJ TYPE: nucleotide 

CO NOMBRE DE BRIMS: simple 

(D) CONFIGURATION: lineal re 

(li) TYPE DE MOLECULE: ADN ( genomi que } 

(vi] ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE; SEQ ID NO : 16: 
GATCCACGCC TGTGCCTACC TTGGCTTTTT GTTCGCCAAA CAAGGCATTT AAGGTTGAGG 6 0 



ACTTGCCGAC ACCTGTCGCA CCG A CAAGCA AGACATCCAA ATGACGGAAA CCGGCTGCTG 120 
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.GACTTTTTG CCCGA7TTCA GAAATACGGT AACGATGCAT ATGCGCTCCT ACCAGCCAAA 130 
AAAAGAAGCA ACCGTGCTAA TCGCCCC7CC AATCGCTTTT GCAGCACCGC CGATC 23 5 

(2) INFORMATIONS POUR LA SEQ ID NO : 17: 

(i) CARACTZRI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 9 pa ires de bases 

(3) TYPE: nucleotide 

(Ci NOME RE DE BRINS : simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi; CRIGINE. 

(A) ORGAN IS ME : Neisseria meningitidis 
(3) SCUCHE: Z2 49 1 



[xij DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17; 

GATCCAA CGG GCATCGCTGT CCTTACTCGG TGTGGTTTGA CCGCTGATTT GTCCTTCTTC 6 0 

GTCAACTTCT ATGGCCTGAC GCTGTTTGCT GCCGGCGGTC TGGATAATGG TGGCATCAAC 12 0 

GACGGCGGCG GATGCTTTCT CTATTTTTAG GCCTTTTTCG GTCAGTTGGC AGTTAATCAG 18 0 

TTTG AGTAAT TCGGACAGGG TGTCGTCTTG CGCCAGCCAG TTGCGGTAGC GG CAT AAGGT 2 40 

ACTGTAATCG GGGATGATC -> 59 
(2 ; INFORMATIONS POUR LA SEQ ID NO : 18: 



(i) CARACTER I ST I QUES DE LA SEQUENCE: 

(A) LONGUEUR: 201 paires de bases 

(B) TYPE; nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 
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(:<l) DESCRIPTION DE LA SEQUENCE. SEQ ID NO: 13: 

GATCTGTGCC GTTGATTTTA TCTTTCAGAT GCAGCATCGA ATATCGGAAA GCCAAATCAG 6 0 

CAATTCTTTT TGCATCGTGT GGATTTTGAG ACGGGCCTAA TGACCGTACC CGCTTAATAA 120 

AAAATGCACC GTCAATCAAA ATGGCGGTTT TCATATTGCT TCCCCTA7AT TTGTCAAAGA 130 
TATAAAAAAG CCCTTGGGAT C 201 
(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(lj CARACTERISTigUES DE LA SEQUENCE: 

(A) LONGUEUR: 33 4 pa ires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineal re 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE : 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE; 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

AATTCAAAGG AGGCATTTGT TGCAAGAAAA GTACAAAGTG ATTTGCAAAA AGCATTGAAT 6 0 

GCTAGCAACT ATAACAAGCA GCAATATGCA AGACGTGCGG CAACAGCGTT AGAGAATGCT 12 0 

TCAAAATCAA AAGTTATGGC AGCGAATTCT TTTTGATCTA TCTTGTGCGA ACGGGTCAAA 180 

TATTCTTCGT A CATTG AGTT AATCGTACCA ATCGCCCTAA CCACATTTTC ATCAGAAAAT 240 

ATGGAAATAA TAGCATCCCT ATA CGCACCT AGTGTAATAT TGTTTCTATT ATTAGTTATA 30 0 

GCATTATTCG AATACATAAT AGCACCTCCA AATT 33 4 
(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 38 pa ires de bases 

(B) TYPE: nucleotide 

;C) NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineal re 
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(ii) TYPE DE MOLECULE: ADN (ae 



60 
120 
130 
238 



enomi que ) 

(vi) CRIGINE. 

fA) ORGANISMS ; Neisseria men i ngi c id is 
(3) SOUCHE: ZZ491 

(xi) DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 20: 

AATTCCTGCG CACCTTTGCC GATGGGGAGA TAATCGCCTT TTTGCAGCAT TCTGCCCTGA 

TGGCCGCCGA AACCGGCTTT CAGGTCGGTA CTTCTCGAAC CCATCACTTC CGGCACATCA 

AATZCGCCCO CCACGCACAC ATAGCCGTAC ATCCCCTGCA CGGCACGCAC CAGTTTCAAG 

GTCTGCCCTT TOCGOGCGGT ATAACGCCAA TACGAATAGA CCGGTTCGCC GTCCAATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i! CARACTERISTIQUES EE LA SEQUENCE: 

(A) LONGUEUR : 249 paires de bases 

(B) TYPE; nucleotide 

(C) NOME RE DE 3RINS: simple 

( D ) CONFIGURATION : 1 i r.eaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
AATTGGGCGA GATGCTGCCG GAAACGGATT TAAAACAGAT TGCGGCGGCA GTGTTGAAGA 6 0 
CGAACGATGA GG CGGCATTG CAGAAGGTGG TGAAAA CGGC CAAAGGCAAT GCGCGGAAAC 120 
TGTCGAAGCT GCTGCTGATT GTGGACTATT TGTTGCAGGT TAACCCTGAT GTTGATTTGG 
ATGATGATGT AATCGAACAC G CGG AAA CCT ATTTAATCCA CTAAACCTTT GACAGATAAG 
GCAATAATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 22: 



180 
240 
249 
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U) CARACTERISTIQUES CE LA SEQUENCE. 

(A) LONGUEUR: 212 pa ires cie bases 

(3) TYPE : nucleotide 

<C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: imeaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(vi) CRIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 

AATTTATGTA CGGTTTTGCC GTTTGCAGTC AGCCAGTCGG CAAGGCGCAG AAAAAAATCG 5 0 

CCGACAGGGC C7TGAAGCAG CAGGATATTT TCTGCGCTTT CAAGCAGGTT TTGCAGGTTA 120 

TTTTTGAGGA CGGTCTGTTT CATGTTGCAA TGTGGTTTTG TTTTTTATGT AATAGTTTTA 130 

GGTTGAACTT TCAAGCATAC GCCAAGAGAA TT 212 
(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 227 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 
(3) SOUCHE: 224 91 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 

AATTCAGTGC CTGCGTCATA TCACGGCTAC CTTGTGGTTC AGGGTTACTG TATCGCCCGC 6 0 

GGCATCGACG GCTTCAATAT GCAGCTTCAG CCAGCCGTGC TGCGGGGCGG ATGCGGTTAC 120 

TTGGATGGAT TGGGCGCGTT TGGACTGAAT CACGGGCTGC AAGGCTTGCT CGGCGTACTG 180 

TTTGGCCAGT ACTTCGATGC GCTTTAAATG CTTTTGGCGG CGCAATT 22 7 
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(2) INFORMATIONS POUR LA SEQ ID NO: 24: 

(i) CARACTERISTICUES DE LA SEQUENCE : 

(A) LONGUEUR : IS 7 pa ires da bases 

(B) TYPE: nucleotide 

(C) NCMBRE DE BR INS: simple 

(D) CONFIGURATION: lmeaire 

(ii) TYPE DE MOLECULE; ADN (genomique) 

(vi) ORIGINE . 

(A) ORGANISME Neisseria meningicidis 

(B) SOUCHE. Z249 1 

Cxi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 24: 
GATCCAGGAC TCAAAAACCG ATTTCCTAAT AGAGTGTCTA ATATCCCAAT CTTTTTTACC 6 0 



CCCTCTGCTG TAGAATTGAT AGAGAAAGTT TGTCTATCTT TTTCATATAC CCATGCCTT 
TTTTTATCAT TGTAGCTAAC ATAACCGCCA AACAATGCTT CTAGATC 
(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 251 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 22491 



C 12 0 



167 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 

AATTCTTGCG GCCATTTCCT GAATGGCTTT AGTCAAAACG GGGATGAACG TTTCGTATTC 6 0 

GACGGTGTAG GTATCGTTTG TTTTATTTAC CATCGGCAAT CGACCATATT CATCTTCCAG 120 

CGCAGCAATG TCCTGGG CAA TAAACCAATG CCGCAACCGA TCTTCTTTAT GACTGCCGTC 180 
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CTTGATTGGA TTCGCCCACC ATTCGCGGAC TTTGTCCGCT CGTTCATCTG CCGGCAAGTC 2-10 

TTTGAATAAT T 25 1 

(2) INFORMATIONS POUR LA SEQ ID NO: 26: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

{A) LONGUEUR: 2C7 paires do bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 
( 0 ) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISMS: Neisseria meningitidis 

(B) SCUCHE: Z24 91 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 

AATTCCCGAC TATCGCGGAT GCGTAGTTTT TGCCGGTGGG CAAGAGCAGG TGTGGGATAA 6 0 

GTTAGGTGAT TTGCCCGATG GCGTCAGCCT GACCCCGCCT GAATCGGTAA ATATTGACGG 120 

CTTAAAATCC GTAAAACTCG TCGCATTAAA TGCTGCGGCT CAGGCTTTTA TTAACAAGCA 180 

CGCCGGTATC GACAGCGTAC CTGAATT 20 7 
(2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 79 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: Z2491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 27: 
AATTGTTTGG GAATAATCCA AACAAACAGC ATCAGGATAG CGGCGGCGGT CAGGCTGCCT 6 0 



FEUILLE DE REMPLACEMENT (RE6LE 2$) 



BNSpQCID- <Vyp 98Q2547A2 I > 



WO 98/02547 



PCT/FR97/01295 



62 

GAAAGGATTT TCCCGGGGTT TTTTGTAGGC AAAGCCGACG AGAAACCAAA GCAACAGCAG 120 

CATGGTGTCC CAATAGCCGA TTGAGAATAG GATGGCCAAA CCT7CTAGGA AATGGCGTAA 130 

ATCGTTTGTG GTAACCATGG GTAGTTCCTG TGGTTAAATG TGCAGGCTGC TTTTTGCCGA 2 40 



AC^i :GCCGC A i CTCAAAAG CAGCCTGCGG TTCAGCGTTG CGTTACGCAG TAAAATAATG 



300 



AATATTTGTA ACGGCITGGG TATTTTTTGT CAATATTCCG GGCCTTCCCT TAACAGCTGC 3 SO 



CGCGCTTTCC GTTAAAATT 

(2 J INFORMATIONS POUR LA SEQ ID NO : 28: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 274 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

Cii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28: 
AATTCGCCGA AATCAGGCTG CTGCTCG AT A AT CGGCGCGG CCGATTGGCG TTGTGCCTCG 



379 



60 



ATTAAATCCA TCTTGTCTTG CAGACGTTTG GCCTGGCCTT TGCGGCGGCG TTCGGCCAGT 120 
TGTTCCATCC GCGTTTCCGC AAA TGCCGCC CGTTTGTTGC CGTTGAATAC CGCTTTGCAA 18 0 
ATCACCTTGC CCTGCATATC CTTCACAATC A CATGGTCGG CATCGTGGAT GTCGTAAGCC 2 40 



ACCCGTACCT TCTGACCGCT GTAATCCAGC AATT 
(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIOUES DE LA SEQUENCE: 

(A) LONGUEUR: 263 pair s de bas s 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 



274 
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(D) CONFIGURATION: lineaire 

Ui) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGAN I SME : Neisseria meningitidis 
(3) SOUCHE: 12491 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 

AATTCCGTTC TTATTGGGCT TTTTCCATCC ATCGGGTATG CCTGAAGGGA ACGCAAACCC 6 0 

TGCCACTTGC CCATCGCTCC ATTCCCGCAT TAGCGCGTCT GACGGCAAGT GTTCTCGCGC 120 

CCAATCAAGC CACGCCTGCC GCATTGCGGC CTTGTCCTGC TGAAAACTTC GCAGTGCTTT 180 

TGCAACCGGC CCATCATTAA CTTCAATCAA ATAAATCATT ATATTTGCGT TCATTTTTCC 2 40 



TACACCTTCG CCACATCCAA ATT 



263 



{ 2 J INFORMATIONS POUR LA SEQ ID NO: 30: 

(i) CARACTERI STIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 316 pa ires cte bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS : simple 

( D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGAN I SME ; Neisseria meningitidis 
(3) SOUCHE: 22491 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 30: 

AATTGTTCAA GAAAAAAGTC GGCACGGCCC GGCAACGGGG AAAATGCGTT GACGCCGTCT 60 

TTTTCTAAGG TGATGTAGTA GGGGCGG AAA TAGCCTTCTT CAAACGCCCA GAAACTGGCT 120 

TGGTTTTCGT TTGCAATGCG TTTTGCAATG ACGTGATAAG GGCGTGTGTC GCCAAAGCAG 180 

ACAACGGCCT GGATGTGATG TTGAGTGATG TATTCTTGCA AAAACTCAGG AAAGGCGTCG 2 40 



TAGTTGTCGT TAAAAACAAC GGTATGCGCT TGAGTGGGCG GATAAAAATA GTCGTCGCCT 3 00 



FEUILLE DE REMPLACEMENT (REGLE 2$ 



B NSOO CID- <WO_9802547A2j_> 



WO 98/02547 



PCT/FR97/01295 



64 

GCATTAAAGT TGAATT 31€ 

(2) INFORMATIONS POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE. 

(A) LONGUEUR : 32 4 pa ires de bases 
;B) TYPE: nucleotide 

(C) NOMBRE DE BRINS. simple 

(D) CONFIGURATION: lineaire 

Ui) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

(B) SOUCHE: 22491 

(Xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 31: 

AATTCAATCA ACGGAAAACA CATC AG CATC AAAAACAACG GTGGTAATGC CGACTTAAAA 6 0 

AACCTTAACG TCCATGCCAA AAGCGGGGCA TTGAACATTC ATTCCGACCG GGCATTGAGC 120 

ATAGAAAATA CCAAGCTGGA GTCTACCCAT AATACGCATC TTAATGCACA ACACGAGCGG 180 

GTAACG CTCA ACCAAGTAGA TGCCTACGCA CACCGTCATC TAAGCATTAC CGGCAGCCAG 240 

ATTTGGCAAA ACGACAAACT GCCTTCTG CC AACAAGCTGG TGGCTAA CGG TGTATTGGCA 300 

CTCAATGCGC GCTATTCCCA AATT 32 4 
(2) INFORMATIONS POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 30 pa ires de bases 

(B) TYPE: nucleotide 

CC) NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(iil TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME: Neisseria meningitidis 

( B ) SOUCHE: Z2491 
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;xi) DESCRIPTION CE LA SEQUENCE : SEQ ID MG : 32: 

AATTATGCAA AAAAACGCAA CGCCGAAAAA CTGGCACCGC GCGGATATTG TTGCTGCTTT 6 0 

GAAAAAGAAA GGCTGGTCAC TTCG AGCACT TTCAATAGAA GCGGGGTTGT CGCCGAATAC 120 

GCTTAGA AGC GCACTGGCCG CCCCTTATCT TAAGGGAGAA AGGATTATTG CCGCTGC A AT 130 

CGGAGTGGAA CGGG A AG AG A TTTGGTCCGA ACGGTATGCA GATCGGAATT 230 

(2) INFORMATIONS POUR LA SEQ ID NO: 33: 

(U CARACTERISTIQUES DE LA SEQUENCE: 

(A) LCNGUEUR : 249 paires de bases 

(3) TYPE: nucleotide 

fC; MCMBRE ZE 3RINS : simple 

(D) CONFIGURATION: lineal re 

(11) TYPE DE MOLECULE : ADN (genomique) 

(vi ) ORIGIN: 

(A) ORGANISE: Neisseria meningitidis 
(3) SCUCHE: 22491 

(xi) DESCRIPTION CE LA SEQUENCE : SEQ ID NO: 33: 

AATTTAAT" GTGGAATGCC TGTTCAACCG CACCAATCCC GCTGAATACG GTTGCTAATC 6 0 

TAATATGTGA ATCAGGTTTA AGAAAAGTTT TAGATTTCCA ACCTTGTTGA CTGGGAAAGA 120 

GCAAAGTTTT TTGTAATCGA GTATCGTGTG TCTGTGCCAT TGTCGAAATA GTCATACTTA 18 0 

TATCGTTCTG TTTA T CTT AT CAATATGAAA ACTACATCGT TGATTGCCCT GACAATGCCT 2 40 

TGGTCAATT 2 4 9 

(2) INFORMATIONS POOR LA SEQ ID NO: 34: 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 343 paires de bases 

£B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

:D1 CONFIGURATION: lineaire 

:n) TYPE DE MOLECJLE. ADN (genomique) 
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(vi ) CRIGIME: 

(A) CRGANISMH: Neisseria meningitidis 
(31 SCUCHE. ZZA91 

\:<i) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3-1: 

AATTC7TGTC CC3GAGTCCA ACGTATATTT ACCCTCCTGC GAGCTAAAAG ACTA77 AT" 



rCCACTGCCA CAGTAGCCGC A7TCACCGCC GTATTCACAT CCCCTTTAAC CAATGCCAC7 



120 



GCGCTGCCTG CGATAA > CTG CGAGTAGGCT ATGAC7TT7T GG CGTTCTTG GGGTGACAGT 180 



i.GCCTACAi CG CGTCCGTC CAACAGGGTT TCTCCCACCA TCTCGCCGAC TGCCGCGCCG 



140 



ATTGCGCCGT CCCGACATTT GCCTTTATTT GC7ACCGCCG ATGCACAGCC TGCTACGGCA 30 0 



"GGGv- 1 ATCT TG i GGGCAAT G7AGTCTTCG CTGAGATTAA ATT 



343 



(2) INFORMATIONS POUR LA SEQ ID NO : 35: 

!i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 184 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE 3RINS : simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

(vi) CRIGINE: 

(A) ORGANISMS: Neisseria meningitidis 
(3) SOUOE: 22491 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35: 



AATTCTTCAA ACATCGTTTC GATAATCGGG TCGGTGTACA CACTGATGCG GTCGCCCGCA 



60 



CGGCTTTGAC CGGCTCGGAA AATATAGGCG GTGGCTTTGC CGTCGGCGAT GTCGACGCAC 120 
CAACGCCAGA TGGCGTCTTC GGTATTCAAA CAATCACCCG CACAGCTTTC ACCTGCGCGG 180 



AATT 



184 



(Xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 36: 
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TATCCTCAAT CTCATTTTCA AAATGCAAAA CTTTTCTGAT TTTTCCTA CT TTTTGCTCAA 6 0 

TATTAGGAAG GTTTTAGGCA ATTGAAAATT TTTTGGCGCA TTTTTATGCG TCAAATTTCG 120 

TTAACAGACT ATTTTTGCAA AGGTCTCCGT CTGTAAAAGC AAGGATAGGG CATCTGCCCT ISO 

TTTGATTGTT TGATTAACGA TACAAGGAGT TTCAAAATGA GAGTTTTATA GTGGATTAAC 2 4 0 

AAAAACCAGT ACAGCGTTGC C7CGCCTTGC CGTACTATTT GTACTGTCTG CGGCTTCGTC 3 00 

GCCTTGTCCT GATTTAAATT TAATCCACTA TATGTGTTCA TGAAATGACT TGGGTCGGAG 3 60 

GCTCAGGTAA TGCGCAACAA AGTTCATATT ATTGCGAAAT TTGCGAATCT GCAGGGCTTA 4 20 

ACGATACGGG AAATCCTGAT AAATCTTTAG GATTGCCAAA CAATACGTTC AGTAATCCGC 4 80 

CTGGTTGGGG AGCTACAATC GGAGCTTTAG CAGGTAGCCG CATAGGTATG CCTGAATTTG 5 40 

GTACGTTTGC GAGCCATGCC ATTGAAAATT TCGACTGGTC ATGGTATCGA CGTTATAGGG 6 00 

AAATTGCCGA AAGGATTGAA CGAGAATATT CAGGCGGTTT GCCTT AATAG TTGAGGAGGT 6 60 

CATGATGTTT GCCAAACATT ATCAATTCAT CGCACTCGGC ATCATGCTGC TTCTTTATAT 7 20 

GTTGATTCTC TATACGACCG ATTTTTCCAA TCTGACGTAT TGGATGCTGT TTTTTATCTG 7 80 
TTTTATTACA GG AAAAATAT TAGCTCGTTT GTTAGAGAAA AGCTTTAAAT AAAATAGCAG 84 0 

CTAGTCGCAA AAGGTCGTCT GAAACCTTTT CAGGCGGCCT TTCTAAAATA CATCCAACTT 90 0 

CCTAATCCCT ATTTTTCAAA AAGGAAATCT ATGCCCCATC TGCAAAACCT GTCTTTGGGC 96 0 

TTAAAGAAAA AGCTGCCTGT TATCCTGCAA ACAGAAATAT CAGAATGCGG CTTGGCATGT 102 0 

CTGGCGGCTG TGGGGGGATT TCATGGTTTC CATACGAATT TACGCGCACT GCGTTCAAAA 108 0 

TACTGTCCGA GACCTTTGCA AAATTCCCCA AAATCCCCTA AATGTCTTGG TGGGAATTTT 114 0 

GGGGAATTTT GCAAAGGTCT CATTCTATAA CTGTAAATAC TTTTAAATTT ATGACAAAAT 120 0 

AGTAAATATT GCTAAAATAA TATTGATGTC ATGAAATTTT TTCCTGCTCC ATGTCTGTTG 126 0 

GTTATCCTGG CTGTCAT A CC CCTTAAAACC TTAGCTGCCG ATGAAAACGA TGCAGAACTT 132 0 

ATCCGTTCCA TGCAGCGTCA GCAGCACATA GATGCTGAAT TGTTAACTGA TGCAAATGTC 138 0 

FEUILLE DE REMPLACEMENT (REGLE 2$) 



BNSDOCID: <WO 9802S47A2 I > 



WO 98/02547 PCT/FR97/0 1 295 

68 

CGTTTCGAGC AACCATTGGA GAAGAACAAT 7A7GTGCTGA GTGAAGATGA AACACCGTGT 14 40 

ACTCGGGTAA ATT AC ATT AG TTTAGATGAT A AG A CGGCGG GCAAATTTTC TTTTCTTCGT 1500 

TCTGTGCTCA TGAAAGAAAC AGCTTTTAAA ACTGGGATGT GTTTAGGTTC CAATAATTTG 15 60 

AGGAGGGTAC AAAAAGCCGG GCAACAGATA CTGATTGTGC GTGGCTACCT CACTTCGCAA 16 20 

GCTATTATCC AACCACAGAA TATGGATTCG GGAATTCTGA A A TT A CGGGT ATCAGCAGGC 168 0 

GAAATAGGGG ATATCCGCTA TGAAGAAAAA CGGGATGGGA AGTCTGCCGA GGGCAGTATT 17*10 

AGTGCATTCA ATAACAAATT TCCCTTATAT AGGAACAAAA TTCTCAATCT TGGGGATGTA 130 0 

G AG GAGGGCT 7GGAAAACC7 GCGTCGTTTG CCGAGTGTTA AAACAGATAT TCAGATTATA 186 0 

CGGTGGGAAG AAGAAGGCAA AAGGGATTTA CAGATCAAAT GGGAGCAGAA TAAACCCATA 19 20 

CGG TTCAGTA TCGGTATAGA TGATGG'GGGC GGCAAAACGA CCGG CAAATA TCAAGGAAAT 198 0 

GTCGCTTTAT CGTTCGATAA CCCTTTGGGC TTAAGCGATT TGTTTTATGT TTCATATGGA 204 0 

CO CGGTTTGG TGCACAAAAC GGACTTGACT GATGCCACCG GTACGGAAAC TGAAAGCGGA 210 0 

TCGAGAAGTT ACAGCGTGCA TTATTCGGTG CCCGTAAAAA AATGGCTGTT TTCTTTTAAT 216 0 

CACAATGGAC ATCGTTACCA CGAAGCAACC GAAGGCTATT CCGTCAATTA CGATTACAAC 2 220 

GGCAAACAAT ATCAGAGCAG CCTGGCGGCC GAGCGCATGC TTTGGCGTAA CAGGTTTCAT 228 0 

AAAACTTCAG TCGGAATGAA ATTATGGACA CGCCAAACCT ATAAATACAT GGACGATGGG 23 40, 

GAAATCGAAG TGCAA CG CCG CCGGTCTGCA GGCTGGGAAG CCGAATTGCG CCACCGTGGT 2 4 00 

TACCTCAACG GTTGGCAGCT TG A CGGCA AG TTGTCTTACA AACGCGGGAC CGGCATGCGG 2 460 

CAAAGTATGG CCGCACCTGA AGAAAACGGC GGOGGTACTA TTCCAGGCAC ATCCCGTATG 2 520 

AAAATCATAA CCGCCGGATT GGATGCAGGG GCCCCGTTTA TGTTGGGCAA ACAGCAGTTT 2 5 80 

TTCTACGCAA CCGCCATTCA AGCTCAATGG AACAAAACGC CTTTGGTTGC CCAAGACAAG 2 64 0 

TTGTCTATCG GCAGCCGCTA CACCGTTCGC GGATTTGATG GGGAGCAGAG TCTTTTCGGA 2 7 00 
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GAGCGAGGTT TCTAC7GGCA GAATACTTTA ACT7GGTATT TTCATCCGAA CCATCAGTTC 27 SO 

TATCTCGGTG CGGACTATGG CCGCGTATCT GGCGAAAGTG CACAATATGT ATCGGGCAAG 23 2 0 

CAGCTGATGG G7GCAGTGGT CGGCTTGAGA GGAGGGCATA AAGTAGGCGG TATGTTTGCT 2 3 30 

TATGATCTGT TTGCCGGCAA GCCGGTTCAT AAACCCAAAG GCTTTCAGAC GACCAACACG 2 9 4 0 

GTTTACGGCr TGAACTTGAA TTACAGTTTC TAACCTCTGA ATTTTTTTAC TGATATTTAG 300 G 

ACGGTCTTTC CT7ATCCTCA GACTGTCAAA CTTTACCTAC GTACTTGGGG CGCAGTACGT 30 6 0 

TCATCTTCAA AATGGAATAG ACATGAATAA AGGTTTACAT CGCATTATCT TTAGTAAAAA 3120 

GCACAGGACG A7GG7TGCAG TAGCCGAAAC TGGGAACAGG CAGGGCAAAG GTAAA CAGGG 3180 

AGGCAGTTCG GTT TCTGTTT CACTGAAAAC TTCAGGCGAC CTTTGCGGCA AACTCAAAAC 3 240 

CACCCTTAAA ACCT7GGTCT GGTCTTTGGT TTCCGTGAGT ATGGTATTGG CTGCCCATGC 3 30 0 

GCAAATTACC ACCGACAAAT CAGCACCTAA AAA CCAGCAG GTCGTTATCG TTAAAACCAA 3 3 60 

CACTGGTGCC CCCT7GGTGA ATATCCAAAC TCCGAATGGA CGCGGATTGA GCCACAACCG 3 4 20 

CTATACGCAG TTTGATGTTG ACAACAAAGG GGCAGTGTTA AACAA CGACC GTAACAATAA 3 48 0 

TCCGTTTCTG GTCAAAGGCA GTGCGCAATT GATTTTGAAC GAGGTACGGG GTACGGCTAG 3 54 0 

GAAACTGAAC GGCATCGTTA CCGTAGGCGG TCAAAAGGCC GACGTGATTA TTGCCAACCC 3 6 00 

CAACGGCATT ACCGTTAATG GCGGCGGCTT TAAAAATGTC GGTCGGGGCA TCTTAACTAT 3 6 60 

CGGTGCGGCC CAAATCGGCA AAGACGGTGC ACTGACAGGA TTTGATGTGC GTCAAGGCAC 37 20 

ATTGACCGTA GGAGCAGCAG GTTGGAATGA TAAAGGCGGA GCCGACTACA CCGGGGTACT 37 8 0 

TGCTCGTGCA GTTGCTTTGC AGGGG AAA TT ACAGGGTAAA AACCTGGCGG TTTCTACCGG 3 84 0 

TCCTCAGAAA GTAGATTACG CCAGCGGCGA AATCAGTGCA GGTACGGCAG CGGGTAGGAA 3 90 0 

ACCGACTATT GCCCTTCATA CTGCCGCACT GGGCGGT ATG TACGCCGACA GCATCACACT 3 960 

GATTGCCAAT GAAAAAGGCG TAGGCGTCAA AAATGCCGGC ACACTCGAAG CGGCCAAGCA 402 0 

ATTGATTGTG ACTTCGTCAG GCGGCATTGA AAACAGGGGC CG CAT CG CCA CCACTGCCGA 4 08 0 
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CGGGACCGAA GC7TGACCGA CT7A7CTG7C CATCGAAACC ACCGAAAAAG GAGCGGCAGG 4 140 

CACATTTATC 7CCAATGGTG G7CGGATCGA GAGCAAAGGC 77A77GGT7A TTGAGACGGG 4 2 00 

AGAAGA7A7C AGCTTGCGTA AGGGAGCCGT GGTGCAGAAT AACGGCAGTC GCCCAGCTAC 4 2 60 

CACGGTATTA AATGCTGGTC ATAATTTGGT GATTGAGAGT AAAACTAATG TGAACAATGC 4 3 20 

CAAAGGCTCG GCTAATCTGT CZGCCGGCGG TCGTACTACG ATCAATGATG CTACTATTCA 4 38 0 

AGCGGGCAGT TCCGTGTACA GCTCCACCAA AGGGGATACT GAATTGGGTG AAAA7ACCCG 4 4 40 

TATTATTGGT GAAAACGTAA CCG7A77A7C TAACGGTAGT ATTGGCAGTG CTGCTGTAAT 4 5 00 

TGAGGCTAAA GACACTGCAC ACATTGAATG GGGCAAACCG CTTTCTTTAG AAACCTCGAC 4 560 

CG77GCGTGG AACATCGGTT TGAACAACGG TAACATTAAA GGCGGAAAGG AGGTTGGTTT 4 6 20 

ACTGGCAGAC GATAACATTA GTGGCAAAAC TACCAATCTG AA7ACTCCCG GCAATCTGTA 4 6 30 

TGTTCATACA GGTAAAGATC TGAATTTGAA TGTTGATAAA GATTTGTCTG CCGCCAGCAT 4 7 40 

CCATTTGAAA TCGGATAACG CTGGCCATAT TACCGGCACC AGTAAAACCC TCACTGGCTG 4 8 0C 

AAAAGACATG GGTGTGG A GG CAGGCTTGCT GAATGTTA CC AATACCAATC TGGGTACCAA 4 86 0 

CTCGGGTAAT CTGCACATTC AGGCAGCGAA AGGCAATATT CAGCTTCGCA ATACCAAGCT 4 9 20 

GAACGCAGCG AAGGCTCTCG AAACGACGGG ATTGCAGGGG AATATCGTTT GAGACGGCGT 4 9 80 

TCATGCTGTT TCTGCAGACG GTCATGTATC CTTATTGGGG AACGGTAATG CCGACTTTAC 5 0 40 

CGGTCACAAT ACGCTGACAG CCAAGGCCGA TGTCAATGCA GGATCGGTTG GTAAAGGCCG 5100 

TCTGAAAGCA GACAATACCA ATATCACTTC ATCTTCAGGA GATATTA CGT TGGTTGCCGG 5160 

CAACGG7AT7 CAGCTTGGTG AGGGAAAACA ACGCAATTCA A7CAACGGAA AACACATCAG 5 220 

CATCAAAAAC AACGGTGGTA ATGGCGACTT AAAAAACCTT AACGTCCATG CCAAAAGCGG 5 2 80 

GGCATTGAAC ATTCATTCCG ACCGGGCATT GAGCATAGAA AATACCAAGC TGGAGTCTAC 5 3 40 

CCATAATACG CATCTTAATG CACAACACGA GCGGGTAACG CTCAACCAAG TAGATGCCTA 5 4 00 
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CGCACACCGT CATCTAAGCA TTACCGGCAG CCAGATTTGG CAAAACGACA AACTGGCTTC 5*160 

TGGCAACAAG CTGGTGGCTA ACGGTGTATT GGCACTCAAT GCGCGCTAT7 CCCAAATTGC 5 5 20 

CGACAACACC ACGCTGAGAG CGGGTGCAAT CAACCTTACT GCCGGTACCG CCCTAGTC\A 5 58 0 

GCGCGGCAAC ATCAATTGGA G7ACCG7T7C GAGCAAGACT TTGGAAGATA A7GCCGAAT7 5 6 4 0 

AAAACCATTG GGCGGACGGC TGAATATTGA AGCAGGTAGG GGCACATTAA CCATCGAACC 5 70 0 
TGCCAACCGC ATCAGTGGGC ATACCGACCT GAGGATCAAA ACAGGCGGAA AATTGGTGTT *~ 5 760 

GTCTGCAAAA GGAGGAAATG CAGGTGCGGG TAGTGCTCAA GTTTGCTCAT TGGAAGCAAA 58 20 

AGGGAATATG CGTCTGGTTA CAGGAGAAAC AGATTTAAGA GGTTCTAAAA TTACAGGGGG 58 8 0 

TAAAAACTTG GTTGTCGCCA CCACGAAAGG CAAGTTGAAT ATCGAAGCCG TAAACAACTC 59 40 

ATTGAGGAAT TATTTTCCTA CACAAAAAGC GG CTGAACTC AACCAAAAAT CCAAAGAATT 60 0 0 

GGAACAGCAG ATTGCGCAGT TGAAAAAAAG CTCGCCTAAA AGCAAGCTGA TTCCAACCCT 606 0 

GCAAGAAGAA CGGGACCGTC TCGCTTTCTA TATTCAAG CC ATCAACAAGG AAGTTAAAGG 6120 

TAAAAAACGC AAAGGCAAAG AATACCTGCA AGCCAAGCTT TCTGCACAAA ATATTGACTT 6180 

GATTTCCGCA CAAGGGATCG AAATCAGCGG TTCCGATATT ACCGCTTCCA AAAAACTGAA 6 24 0 

CCTTCACGCG GGAGGGGTAT TGGGAAAGGG AG GAG ATT C A GAGGCGGCTG CTATTCTGAT 6 3 00 

TGACGGGATA ACCGACCAAT ATGAAATTGG GAAGCCCACC TACAAGAGTC ACTACGACAA 6 360 

AG CTGCTCTG AACAAGCGTT CACGTTTGAC CGGACGTACG GGGGTAAGTA TTCATGCAGC 6 4 20 

TGCGGGACTC GATGATGCAC GTATTATTAT GGGTGCATCC GAAATCAAAG CTCCCTCAGG 6 480 

GAG CAT AG AC ATGAAAGGCC ATAGTGATAT TGTACTGGAG GCTGGACAAA A CG ATGCCTA 6 54 0 

TACCTTCTTA AAAACCAAAG GTAAAAGCGG CAAAATCATC AGAAAAACCA AGTTTACCAG 6 600 

CACCCGCGAC CACCTGATTA TGCCAGCCCC CGTCGAGCTG ACCGCCAACG GTATCACGCT 6 66 0 

TCAGGCAGGC GGCAACATCG AAGCTAATAC CACCCGCTTC AATGCCCCTG CAGGTAAAGT 6 7 20 

TACCCTGGTT GCGGGTGAAG AGCTGCAACT GCTGGCAGAA GAAGGCATCC ACAAGCACGA 6 730 
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GTTGGATGTC CAAAAAAGCC GCCGCTTTA7 CGGCATCAAG GTAGGTAAGA GCAATTACAG 6 8-10 
TAAAAACGAA CTGAACGAAA CCAAATTGGC 7G7CCGCG7C GTCGGCGAAA C7GCAGCCAC 6 900 
CCG77CAGGC TGGGATACCG 7GC7CGAAGG TAGCGAATTC AAAACCACGC TGGCGGGTGG 6 960 
CGACATTCAG G G AGGTGTAG GCG AAA AAGC CGGTGTCGAT GGGAAAATTA TCGTCAAAGG 7 0 20 

CATTGTGAAC CGTA7CCAG7 CGGAAGAAAA ATTAGAAACG AACTCAACCG TATGGCAGAA 7 08 0 

ACAGGGGGGA CGGGGCAGGA GTATCGAAAC GCTAAAACTG CCCAGCTTCG AAAGCGCTAC 7140 
TCCGCCGAAA TTGTCCGGAC CCGGCGGCTA TATCGTCGAG ATTCCGAAAG GCAATCTGAA 7 200 
AACCGAAATC GAAAAGCTGT CCAAACAGCG CGAG7ATGCC TATCTGAAAC AGCTCCAAGT 7260 

AGCGAAAAAC ATCAACTGGA ATCAGGTGGA GGTTGCTTAC GACAGATGGG ACTACAAACA 7 3 20 

GGAGGGCTTA ACCGAAGCAG GTGCGGCG AT TATCGCACTG GCCGT7ACCG TGGTCACCTG 7 38 0 

AGGCGCAGGA A CCGG AG CCG TATTGGGATT AAACGGTGCG GCCGCCGCCG CAACGGATGG 74 4 0 

AGCATTGGCG TCTTTGGCCA GCCAGGCTTC CG7A7CG77C ATCAACAACA AAGGCGATGT 7500 

CGGCAAAACC CTGAAAGAGC TGGGGAGAAG CAGCACGGTG AAAAATCTGG TGGTTG CGGG 75 6 0 

CGCTACCGCA GGCGTAGCCG ACAAAATCGG CGCTTCGGCA CTGAACAATG 7CAGCGATAA 76 2 0 

GCAGTGGATC AACAACCTGA CCGTCAACCT AGCCAATGGG GGGAGTGCCG CACTGATTAA 76 8 0 

TACCGCTGTG AACGG CGGCA GCCTGAAAGA CAA7C7GGAA GCGAATATCG T7GCGGC77T 7 7 40 

GGTCAATACC GGGCATGGAG AAGCAGCCAG TAAAATCAAA CAGTTGGATC AGGACTACAT 7800 

AGTCCACAAG ATTGCCCATG CCATAGCGGG CTGTG CGGCA GCGGCGGCGA ATAAGGGCAA 78 60 

GTGTCAGGAT GGTGCGATAG GTGCGGCTGT GGGCGAGATA GTCGGGGAGG CTTTGACAAA 7 9 20 

CGGCA AAAAT CCTGACACTT TGACAGCTAA AGAACGCGAA CAGATTTTGG CATACAGCAA 7 9 80 

ACTGGTTGCC GGTACGGTAA GCGGTGTGGT CGGCGGCGAT GTAAATG CGG CGGCG AATGC 80 4 0 

GGCTGAGGTA GCGGTGAAAA ATAATCAGCT TAGCGACAAA GAGGGTAGAG AATTTGATAA 3100 
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CGAAATGACT GCATGCGCCA AACAGAATAA 7CC7CAAC7G TGCAGAAAAA ATACTGTAAA 3 160 

AAAGTATCAA AATGTTGGTG ATAAAAGACT 7GCTGGT7C3 ATTGGAATAT GTACGGATAT 8 2 20 

ATCCGGTAGT ACTGAATG7A GAAGAATGAG AAAACAACAT T7GA7CGA7A G7AGAAGCC7 8 2 30 

7CA77CA7C7 7GGGAAGCAG GTGTAATTGG TAAAGATGAT GAATGGTATA AATTATTCAG 3 3 A C 

CAAATCTTAC ACCCAAGCAG A777GGC777 ACAGTCTTAT CATTTGAATA CTGCTGCTAA 3 40 C 

ATCTTGGCTT CAA7CGGGCA ATACAAAGGG TTTATCGGAA TGGATGTCGG ACCAAGGTTA 3 4 60 

TACACTTATT TGAGGAGTTA ATCCTAGATT CATTGGAATA CCAAGAGGGT TTGTAAAACA 8 5 20 

AAATACACCT ATTACTAATG TCAAATACGG GGAAGGGATC AGTTTCGATA CAAACCTAAA 3 53 0 

AAGACATGTG GGAAA7GG7G A7GG777TAG 7 GA AG A A GAG GGCA7TAAAG GAGGGGA 7AA 3 640 

CCGCACCAA7 777A7GGCAG AAC7AAA77C ACGAGGAGGA CGCG7AAAA7 C7GAAACGCA 8 7 00 

AAC7GA7A77 GAAGGGA77A CCCGAATTAA A7A7GAGA7T CG7ACACTAG ACAGGACAGG 87 6 0 

7AAACCTGA7 GG7GGA77TA A GG AAA 777 G AAG7A7AAAA AC7G7TTA7A A7GC7AAAAA 88 20 

A7777C7GA7 GA7AAAA7AC 77GAAA7GGC 7CAAAA7GC7 GG7TCACAAG GA7A77GAAA 8 88 0 

AGCCTC7AAA A77GCTCAAA A7GAAAGAAC 7AAA7CAA7A 7CGGAAAGAA AAAA7G7CA7 39 4 0 

7GAA77CTCA GAAACG777G AC3GAA7CAA A777AGA7CA 7ATTTTGATG 7AAA7ACAGG 9 00 0 

AAGAATTACA AACA77CACC GAGAA7AA77 7AAAGGAAAA ATTA7GAAAA A7AA7AT777 9 0 60 

7C7AAAC77A AA7AAAAAA7 C7A7AAA7AA CAA CCA 7777 G77A777CGA 7T777777GA 9120 

AACAA777AC CAA777GAAA C7AAAGA7AC GC7777AGAG 7G7777AAAA A7A77ACAAC 9180 

TACCGGACA7 777GGAG7AA 7AGG7GC7CA A7ATGAAAAA ATAGATGCTA CCAGA7CGA7 92 40 

7GGAGA77A7 GAAGAGG7AA A7GGA777GA G7A7A77GA7 AAAGC7GG77 CT A 777 A 777 9 3 00 

77CAG77GGA GA7GA777CA A7CC7GAAGA A77AA77A7A CC7A77AA77 7AGCATA7CA 9360 

T7ACT77AA7 A77GCAA7A7 G7GATT7C77 AATAGCTCAC CC7GAA7A7C AAAAAAAGTG 94 20 

TAAAGAAA7A CAAAAAACA7 ATTCTCAAAC AAAC7G7AGC CTGCATGAAA CCTAAAA7CG 9 4 80 
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ATGCGTAACG TGTGTGCTTC AGCACCCACG CGTTCCATGA TTTACGGCTC AATGCCGTCT 95 4 0 

GAAAAGCTCA CAATTTTTCA GACGGCATTT GTTATGCAAG TAAATAT7CA GATTCG~AT 96 0 0 

A7ACTGCCGA GACGCGTGGG TGCTGAAGAC ACCCCC7ACG CTTGCTGGAG AACTTTCGGG 9660 

TAAAAGCGGT GTGAGCATTA GCGCACCGTA TGGCAATGAG AACAGTCGGA TCCTGCTCAG 9 7 20 

CACCACGGAT ATCAGTTCGG AAAACGGCAA AATCAAAATT CAATCTTACG GTGACCAATA 97 SO 

TTACTATGCG AGACAGAGCG AACTCTATAC CTTTGAACGC CGCAGCTACA AAACTGGCAA 9S4 0 

ATGGTACAAC CGCAAACACA TTACCGAAGT CAAAGAACAC AAAAACGCCA AGCCC3ACGC 9900 

AGTAAACCTC AGCGCATCCC AAGGCATCGA CATCAAATCT GGTGGCAGCA TCGACGCCTA 9960 

CGGCACCGCA TTGGATGCCC CCAAAGGGAG CATTAACATC GAAGCCGGGC GGAAATTGAC 10020 

ACTCTATGCC GTAGAAGAGC TCAACTACGA CAAACTAGAC AGCCAAAAAA GGCGCAGATT 100 80 

TCTCGGCATC AGCTACAGCA AAGCACACGA CACCACCACC CAAGTCATGA AAACCGCGCT 10140 

GCCCTCAAGG GTAGTTGCAG AATCAGCCAA CCTCCAATCG GGCTGGGATA CCAAACTGCA 10200 

AGCCACACAG TTTGAAACCA CACTGGGTGG CGCAACCATA CGCGCAGGCG TAGGTGAGCA 1026 0 

GGCACGGGCA GATGCCAAGA TTATCCTCGA AGGGATCAAA AGCAGCATCC ACACAGAAAC 10320 

CGTGAGCAGC AGCAAATCTA CTCTATGGCA AAAACAGGCA GGACGGGGCA GTAACATCGA 10 380 

AACGTTGCAA TTGCCGAGTT TCACCGGTCC CGTTGCGCCC G7ACTGTCCG CACCCGGCGG 104 4 0 

TTACATTGTC GACATTCCGA AAGGCAATCT GAAAACCCAA ATCGAAACCC TCACCAAGCA 105 00 

GCCCGAGTAT GCTTATTTGA AACAACTTCA AGTTGCGAAA AACATCAACT GGAATCAGGT 10560 

GCAGCTTGCT TACGATAAAT GGGACTACAA ACAGGAGGGC ATGACACCCG CAGCAGCAGC 1062 0 

TGTCGTCG1T ATCGTCGTAA CCGTATTGAC CTACGGTGCA CTGTCCGCCC CGGCAGCCGC 10680 

C3GAACGGCG GGCGCGGCAG GCGCAGGAGC GGGAGGAGCC GCAGCAGGAA CGGCAGCCGG 107 40 

AACTGGAGTA GCAGCAGGAA CGGCAGCCAC AACCGGAGTA GCAGCAGGCA CATCAGCTGC 10800 
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AGCTATCACC ACAGCCGCAG GCAAAGCCGC ACTGGCCAGT CTCGCCAGCC AAGCCGCAGT 108 6 0 

TTCCCTCATC AACAACAAAG GAGACATAAA CCATACCCTG AAAGAACTGG GCAAAAGCAG 109 20 

CACCGTC AG A CAGGCGGGC^A CZGCCGCCGT AACCGCAGGC GTACTGCAGG GCA7AAGCGG 10980 

GCTGAACACC CAAGCAGCCG A AG CCGTCAG CAAACA I'll I CACAGTCCC3 CAGCAGGCAA 110*10 

ACTGACCGCT AACC7GA7CA ACAGCACCGG TGCCGCAAGT GTCCATACCG CCATCAACGG 11 100 

CGGCAGCCTG AAAGACAACT TGGGCGATGC CGCACTGGGT GCGATAGTCA GTACCGTACA 11160 

CGGAGAAGTA GCGAGCA AAA TCAAATTTAA TCTCAGCGAA GACTACATTG CCCACAAGA7 11220 

AGGCCATGCG GTAGCAGGCT GTGCATCGGC GGTAGCAAAT AAAGGCAAAT GTCGGGACGG 11280 

CGCAATCGGG GCZGCAGTCG GC3AGA7GG7 GGGAGAAACC CTGTTGGACG G ACGCG ATGT 113 4 0 

AGGGAAACTG TCACCCCAAG AACGGCAAAA AGTCATAGCC TACTCGCAGA TTATCGCAGG 11400 

CAGCGCAGTG GGATTGGTTA AAGGGGATGT GAATACGGCG GTGAATGCGG CTACTGTGGC 11460 

AGTGGAGAAT AATAGTCTTT TAGCTCGCAG GAGGGTAAAT ATACGTTGGA CTCCGCGACA 11520 

AGAATTGGAA CATGAATATG GCA77C7TGA AATCCAGGCC ATTACCAATC AAATCCGAAG 11580 

GCTGGATCCG AAATTTAACG GGATTGCTAT TCTGAGGACT CCTGGAGAGC CGTGGACAAG 11640 

ACATGATGTA CAAACATAGA GGCAATATTA TAATCAATTA AGGGAATCCA GAGGCTTTGC 11700 

TGTTGAACCA A777A7AGAA 7CAGGATAAA CAACGGCAAT GAATTTAACC GTATCATGTC 11760 

ATCAAAATAC CCTTATAATG AGCTTTATGT AG C CAATCCT AAATCGGCGA CGGGGTATTT 11820 

TAGGGTAGA7 TCGTATGATC CTGCGACAAG GGAAATTATT TCAAGAAAAT TTACCCAATT 11880 

TTCTCAAATC CAAGAAAGTA CGGGGATTGG 7TATATCAAG GAGGCTGTTA GAAAATATAG 11940 

CCCTGGTACT GTCATTTCCA ATGTTCCAAG TACACCTACT ACGATAAGAG GAAGAAAGCT 120 00 

TGAAGGAAAA CTTATTTTAG AAGTTCCTGC 7CAGGTCAAT CCAAT7CCAC AA7C7G7A77 120 60 

AAGGGCGGGA CAAGAAGAAA A7G7TA7CA7 7AGAGATACA ACAGGAAGGA 7TTACAAA7G 12120 

AAGAAAGA7A 7T7777AT7G 7GAGCAG7GG 7C77A7GG77 A7AAGAGAC7 7CA7AAGCCT 12180 
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TTTTCTGAGA AACAAGCTGA GGAAAAACAT CTTAAAGGGG AGITATA TAG TGCCGTAATA 12240 

GGTT CGGCGA CACAACGTGA ATATGTAATT AGGTTGGGAG AGGAAGTAGG TTTTTTTTGG 12 300 

GTAAATTTTT TCGATAAATT TGGAAGGGAT TATTTAACCC ATCAATTTGA AAAATATTCG 12 360 

AATTCGAA7T ATTATTTTCT TTCTATGGCT GTATGGAGAG ATTATATAAC TTTGGAATCT 12 420 

CATGACTTAG CAGAAGGATA TACTTATTTC TTCAATGAAA ATACGGATGA TTGCTATGTT 1 2 480 

TTGAAACAAG ATTTTATTAA TAATGAGCGA TATGAAAAAA CAGAATTATA TTCCCAAAAA 12540 

GATAAGGTAA TTC7ATTTCC AAAGTTTGGT GAATATGATT TGGTGTTAAA TCCGGACATT 1 25 00 

ATTTAATTAA GTTTTAAGGG CG7CTGAAAA AAATTTCAAA CGGCTTTTA7 TATTGGGTTT 12660 

GGAATCTGAG GATAAAGGTG ATAAAAACGA GG AAATTATC AG A TTGCTAT ATACGTATTG 127 20 

TTGTACAGAC TAAAGGCAGG AATCAAATCA CTATTGCTTA CCGACAAAAA TAAATTGATT 12780 

ATATGGAATA ATCATGAATA AGAGAATGAA AATGTGTCCT GCTTGTCAAC AAGGCTATCT 12840 

CTACCATTCG AAA CCT AAA T ATCTTCATGA TGAAATTATT CTGTGTGATG AATGCGATGC 129 00 

AGTATGGCTC AAAGGTATGA ATATATTTTA TGGAGAATAT GAAAAAGATT TTTATTCTTA 12 960 

TGTTCCTTTC ATGGAATCCC AAGGTATAAC GAGTGAATGT ATTTGGGAAG GAGATTTGTT 13 020 

TGATCA7CCA TATTATGAAG ATGAAAACTC AAATGATATG GATTGATGGA AATTTTAAGC 13 080 

CTGCGTAGGT A CG ATT AG CC ATCAAACGGC GTAATCATAC GCAAGATTAT CAACAGAGAG 13140 

GGCTGGCAGC GATATACCAC CCACAAGATT GCCCATGCCA TAGCGGGCTG TGCGGCAGCG 13 200 

GCGGCGAATA AGGGCAAGTG TCAGGATGGT GCGATAGGCG CTGCAGTCGG TGAGATTGTT 13 260 

GGTGAGGCTT TGGTTAAGAA TACTGATTTC AGTCGTATGA GTGCGACCGA AATCGAAAAA 13 32 0 

GCTAAAGCGA AGATTACTGC CTATTCAAAA CTGGTTGCCG GCACTGCGTC TGCCGTTGTA 1 3 380 

GGCGGGGATG TGAATACAGC GGCGAATGCG GCACAGATAG CGGTGGAGAA TAATACTTTG 13 4 40 

TATCCTAGAT GCGTTGGTGC AAAGTGTGAT GAATTTCAAA AGGAACAACA AAAATGGATA 13 500 
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CGTGAAAATC CTGAAGAATA TCGAGAAGTT TTGC7TT7TC AGACAGGATT TATTCCAATT 1 3 5 60 

ATCGGTGATA TACAGAGTTT TGTACAAGGA CAGACCGCTG CCGATCACCT GTTTGCTTTG 136 20 

CTGGGTGTGG TTGCGGGTAT CGGTGAATGG ATACAGGCCT ATAAAGTAGG GAAAGCGGGA 1 36 30 

AAAAATTTAC AAGGCATGAA AAAAGCCTTG GAGAAGGCAG CAACCGTTGG CACTGCACAG 13740 

GGCTATGTCA GGAAAACCAA AATCAAAATG GGTCAAACTG AATTAAGGGT TACTGCAGGA 1 3300 

AGTGACAAAC AATTGGTGAA AGCTATT GGC GAAGGAAGGG ACACGACAGG TAAAATGACC 1 38 60 

GAGCAGTTAT TTGACTCTTT AGGTAAACAA AATGGCTTCA GAGTGGTTTG GGGCGGGAAA 1 39 20 

TAGGGGGGAA ATAACGGTTT TGATCATGTA TGGCAGGCTG CGGATGGTAG TGTCGTT7TG 13980 

ATTGTAGAAA GTAAGGAGAT TAGGAACGGT ACGGTACAGC TGAATCGGAA 7GGTGCGGGT 1 4 0 4 0 

GGATATACGG AAATGAGTGA GG ATTGG ATT AGACAAGTTT TAGATCAATT A CGCG ATGGT 14 100 

AGTCCCGCTA AAGCTGGTGT CTTCAAAGCA AATAAGAACG GGACATTAAA AACAGCAATA 14160 

GCAGGCGTTG ATCGTCAAAC AGGTAAGGCC GTTATTCTTC CTGTCAAAGT TCCTTCTAAA 142 20 

ACCAATATAA GGAGATAAGA ATGGGGCACA ATATGATGAC CACCGAAAAA TGGTATGAGC 14 280 

ATATTAGTAlA 7G7AATCATA GGGAATACTG CTAATTTCAA TAGCGGTTGG CTTGACTCTA 14 3 40 

7AGAT7ATG7 AGATGAAAGA AAAGGGGTTC CGGTTGCAGG TATGCAACAT ATTTTCATGG 1 4 400 

ACGTTAGAGG TGGAGGTTGG CATGGGTATC TATTTGAACA TGATCTTAAG AAATTCAAGC 14460 

AATATGCTTA TGTTGGAGGA AAGCTGGGGG TTTTGCTGAG TGTAAATTCT ACAGACCCTG 1 45 20 

AACCCTTGTT CTTTCCGTGT GACATGCTCA ACATTCAAAA TCCGATGTTT CTGATGCTGA 1 4580 

TGAGCGACAG CCCACAGCTG CGTGAGTTTC TGGTGCGCAA TATCGACAAC ATCGCCAACG 14640 

ATACAGAAGG CTTTATAAAC CGCTACGACC TGAACCGGCA TATGATTTAC AATACTCTGC 14 700 

TGATGGTGGA GGGTAAGCAG CTTGATCGGT TGAAACAACG TAG CG AG AAA GTCTTGGCGC 14 7 60 

ATCCGACCCG TAGCAAATGG CTGCAAAAGC GGTTGTACGA ■ TTACCGCTTC TTCCTCGCTT 1 4 820 

TCGCCGAACA GGATGCCGAG GGAATGAAAG CGGCCTTAGA GCCCCTTTTC GATAAAAAAA 148 80 
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CCGCGCGTAT GGC7GCCAAA GAAACATTGT CCTATTTCGA TTTCTACCTG CAGCCGCAAA 1*1940 

TCGTTACCTA CGCCAAAA7C GCATCZATGC ACGGTTTCGA TTTGGGCATA GATCAAGAAA 15000 

7CTCACCGAG GGATTTGATT GTTTACGATG CGGTGCCGGG AGACGAATAT CAAGACATCT 15060 

TCGATTTTAT GAAACAGTAT GACTTGTCTT ACCCGTATGA ATATCTGCAG GATTGGATAG 15120 

ATTACTATAC GTTCAAAACG GATAAGCTGG TATTTGGTAA CGCGAAGCGA GAGTGAGCCG 15180 

TAAAACTCTG AGCTCCTGTT TTATAGATTA CAACTTTAGG CCGTCTTAAA GCTGAAAGAT 1524 0 

TTTCGAAAGC TATAAATTGA AGCGGTTCGA CAGTACATAG ATCTGTGTTG TGGGGGGGCT 1 5300 

TTACCACGCT GATTGGCGGA GAAGAACTCA ACCTGCTGGC AAAACAAGGC ATGAGATCTT 1 5 3 60 

TGCAATAACA 7GAGTTGAGA CCTTTGCAAA AAAGCCCTTC CCCGACATGG GAAACGCAAA 15420 

CACAGGATTT CGG CTGTTTT CGTACGAAAT ACCTCCTAAT TTTACGCAAA TACGCCCTTA 154 80 

ATCGTCCTCG GACACCCGAT AATCAGGCAT CCGGGCTGCC TTTTAGGCGG CAGCGGGCGC 15540 

ATTTAGCCTG TT GGCCGCTT TCAACAGGTT CAAACACATC GCCTTCAGGT GGCTTTGCGC 15 600 

ACTCACTTTG TCATTTCCAA 1 56 20 

(2) INFORMATIONS POUR LA SEQ ID NO; 37: 

(1) CARACTERI STIQUES DE LA SEQUENCE : 
(A) LONGUEUR: 580 acides amines 
(3) TYPE: acid© amine 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE: peptide 

(IX) CARACTERISTICUE: 

(A) NOM/CLE; Protein 

(B) EMPLACEMENT: 1 58 0 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 37: 

Met Lys Phe Phe Pro Ala Pro Cys L u L u Val lie Leu Ala Val II 
15 10 15 
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Pro Leu Lys Thr Leu Ala Ala Asp Glu Asn Asp Aia Glu Leu lie Arg 
20 25 30 

Ser Met Gin Arg Gin Gin His lie Asp Ala Glu Leu Leu Thr Asp Ala 
35 4 0 45 

Asn Val Arg Phe Glu Gin Pro Leu Glu Lys Asn Asn Tyr Val Leu Ser 
50 55 60 

Glu Asp Glu Thr Pro Cys Thr Arg Val Asn Tyr lie Ser Leu Asp Asp 
65 70 75 30 

Lys Thr Aia Arg Lys Phe Ser Phe Leu Pro Ser Val Leu Met Lys Glu 
85 90 95 

Thr Ale Phe Lys Thr Gly Met Cys Leu Giy Ser Asn Asn Leu Ser Arc 
100 105 HO 

Leu Gin Lys Aia Ala Gin Gin He Leu lie Val Arg Gly Tyr Leu Thr 
115 120 125 

Ser Gin Aia lie He Gin Pro Gin Asn Met Asp Ser Gly lie Leu Lys 
130 135 140 

Leu Arg Val Ser Ala Gly Giu He Gly Asp He Arg Tyr Glu Glu Lys 
145 150 155 160 

Arg Asp Giy Lys Ser Ala Glu Gly Ser lie Ser Ala Phe Asn Asn Lys 
165 170 175 

Phe Pro Leu Tyr Arg Asn Lys He Leu Asn Leu Arg Asp Val Glu Gin 
180 185 190 

Giy Leu Glu Asn Leu Arg Arg Leu Pro Ser Val Lys Thr Asp lie Gin 
195 200 205 

He He Pro Ser Glu Glu Glu Gly Lys Ser Asp Leu Gin He Lys Trp 
210 215 220 

Gin Gin Asn Lys Pro He Arg Phe Ser lie Gly He Asp Asp Ala Gly 
225 230 235 240 

Gly Lys Thr Thr Gly Lys Tyr Gin Gly Asn Val Ala Leu Ser Phe Asp 
245 250 255 
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Asn Pro Lau Gly Leu Ser Asp Lau ?he Tyr Val Ser Tyr Gly Arg Gly 
260 265 270 

Leu Vai His Lys Thr Asp Lau Thr Asp Ala Thr Gly Thr Glu Thr Glu 

230 235 

Ser Giy Ser Arg Ser Tyr Ser Val His Tyr Ser Val Pro Val Lys Lys 
290 295 300 

Trp Leu Phe Ser Phe Asn His Asn Gly His Arg Tyr His Glu Ala Thr 
305 310 315 3 20 

Glu Gly Tyr Ser Val Asn Tyr Asp Tyr Asn Gly Lys Gin Tyr Gin Ser 
325 330 335 

Ser Leu Aia Ala Glu Arg Met Leu Trp Arg Asn Arg Phe His Lys Thr 
340 345 350 

Ser vai Gly Met Lys Leu Trp Thr Arg Gin Thr Tyr Lys Tyr lie Asp 
355 360 365 

Asp Aia Glu lie Glu Val Gin Arg Arg Arg Ser Ala Gly Trp Glu Ala 
370 375 380 

Glu Leu Arg His Arg Ala Tyr Leu Asn Arg Trp Gin Leu Asp Gly Lys 
385 390 395 * 400 

Leu Ser Tyr Lys Arg Giy Thr Gly Met Arg Gin Ser Met Pro Ala Pro 
405 410 4i5 

Glu Glu Asn Gly Gly Gly Thr lie Pro Gly Thr Ser Arg Met Lys lie 
420 425 430 

lie Thr Aia Gly Leu Asp Ala Ala Ala Pro Phe Met Leu Gly Lys Gin 
4 35 440 445 

Gin Phe Phe Tyr Ala Thr Ala lie Gin Ala Gin Trp Asn Lys Thr Pro 
450 455 460 

Leu Val Ala Gin Asp Lys Leu Ser lie Gly Ser Arg Tyr Thr Val Arg 
465 470 475 480 

Gly Phe Asp Gly Glu Gin Ser Leu Phe Gly Glu Arg Giy Phe Tyr Trp 
495 490 495 
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Gin Asn Thr Leu Thr Trp Tyr ?he His Pro Asn His Gin Phe Tyr Leu 
500 505 510 

Giy Ala Asp Tyr Gly Arg Val Ser Gly Glu Ser Ala Gin Tyr Vai Ser 
515 520 525 

Giy Lys Gin Leu Met Gly Ala Va i Va 1 Giy Phe Arg Giy Gly His Lys 
530 535 540 

Val Gly Gly Met Phe Aia Tyr Asp Leu Phe Ala Gly Lys Pro Leu His 
545 550 555 560 

Lys Pro Lys Gly Phe Gin Thr Thr Asn Thr Val Tyr Gly Phe Asn Leu 
5c 5 570 575 

Asn Tyr Ser Phe 
- 8 C 

(2) INFORMATIONS POUR LA SEQ ID NO: 38: 

(i) CARACTER I ST I QUE S DE LA SEQUENCE: 
(A) LONGUEUR: 1981 acides amines 
(2) TYPE: acide amine 

(C) NCMBRE DE 3RINS : simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: peptide 

(ix) CARACTERISTigUE : 

(A) NCM/CLE: Peptide 
i'BJ EMPLACEMENT : 1 . .19 81 



(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 38: 

Met Asn Lys Gly Leu His Arg lie lie Phe Ser Lys Lys His Ser Thr 
1 5 10 15 

Met Val Aia Val Aia Giu Thr Aia Asn Ser Gin Giy Lys Gly Lys Gin 
20 25 30 

Aia Gly Ser S r Val S r Val Ser Leu Lys Thr Ser Gly Asp Leu Cys 
35 40 45 
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Gly Lys Leu Lys Thr Thr Leu Lys Thr Leu Val Cys Ser Leu Vai Ser 
50 55 60 

Leu Ser Met Val Lau Pro Aia hks Ala Gin lie Thr Thr Asp Lys Ser 
65 70 75 * ao 

Ala Pro Lys Asn Gin Gin Val Val lie Leu Lys Thr Asn Thr Gly Aia 
35 90 95 

Pro Ldu Val Asn lie Gin Thr Pro Asn Gly Arg Gly Leu Ser His Asn 
100 105 L10 

Arg Tyr Thr Gin Phe Asp Vai Asp Asn Lys Gly Ala Vai Leu Asn Asn 
115 120 125 

Asp Arg Asn Asn Asn Pro Phe Leu Val Lys Giy Ser Aia Gin Leu He 
!30 135 1^0 

Leu Asn Giu Val Arg Gly Thr Ala Ser Lys Leu Asn Gly He Vai Thr 
145 150 155 160 

Val Gly Gly Gin Lys Ala Asp Val lie lie Ala Asn Pro Asn Gly lie 
165 170 175 

Thr Val Asn Giy Giy Gly Phe Lys Asn Val Gly Arg Gly lie Leu Thr 
130 185 190 

lie Gly Ala Pro Gin He Giy Lys Asp Giy Ala Leu Thr Giy Phe Asp 
195 200 205 

Val Arg Gin Gly Thr Leu Thr Vai Gly Ala Aia Gly Trp Asn Asp Lys 
21° 215 220 

Gly Gly Ala Asp Tyr Thr Giy Vai Leu Ala Arg Ala Val Ala Leu Gin 
225 23C 235 240 

Gly Lys Leu Gin Gly Lys Asn Leu Ala Vai Ser Thr Gly Pro Gin Lys 
245 250 255 

Val Asp Tyr Ala Ser Gly Glu He Ser Ala Gly Thr Ala Ala Gly Thr 
260 265 270 

Lys Pro Thr He Ala Leu Asp Thr Ala Aia Leu Gly Giy Met Tyr Ala 
275 280 285 
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Asp Ser lie Thr Leu II© Ala Asn Glu Lys Gly Val Giy val Lys Asn 
290 295 300 

Ala Gly Thr Leu Glu Ala Ala Lys Gin Leu lie Val Thr Ser Ser Giy 
305 310 315 320 

Arg lie Glu Asn Ser Giy Arg lie Ala Thr Thr Ala Asp Gly Thr Glu 
325 330 335 

Aia Ser Pro Thr Tyr Leu Ser lie Glu Thr Thr Glu Lys Gly Ala Ala 
340 345 350 

Gly Thr Phe lie Ser Asn Giy Gly Arg lie Glu Ser Lys Gly Leu Leu 
355 360 365 

Val He Glu Thr Gly Glu Asp lie Ser Leu Arg Asn Gly Ala Val Val 
370 375 380 

Gin Asn Asn Gly Ser Arg Pro Ala Thr Thr Val Leu Asn Ala Gly His 
385 390 . 395 " 400 

Asn Leu Val lie Glu Ser Lys Thr Asn Val Asn Asn Ala Lys Gly Ser 
405 410 415 

Aia Asn Leu Ser Ala Gly Gly Arg Thr Thr He Asn Asp Ala Thr lie 
420 425 430 

Gin Ala Giy Ser Ser Val Tyr Ser Ser Thr Lys Gly Asp Thr Glu Leu 
435 440 445 

Gly Glu Asn Thr Arg He lie Ala Glu Asn Val Thr Val Leu Ser Asn 
450 455 460 

Gly Ser He Gly Ser Ala Ala Val He Glu Ala Lys Asp Thr Ala His 
465 470 475 480 

lie Glu Ser Gly Lys Pro Leu Ser Leu Glu Thr Ser Thr Val Ala Ser 
485 490 495 

Asn He Arg Leu Asn Asn Gly Asn He Lys Gly Gly Lys Gin Leu Ala 
500 505 510 

Leu L u Ala Asp Asp Asn He Thr Ala Lys Thr Thr Asn Leu Asn Thr 
515 520 525 
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530 535 

Asp Lys Asp Leu Ser Ala Ala Ser lis His Leu Lys Ser Asp Asn Ala 
545 550 555 560 

Ala His lie Thr Gly Thr Ser Lys Thr Leu Thr Ala Ser Lys Asp Me t 
565 570 575 

Giy val GIu Aia Gly Leu Leu Asn Val Thr Asn Thr Asn Leu Arg Thr 
580 585 590 

Asn Ser Gly Asn Leu His lie Gin Ala Ala Lys Gly Asn lie Gin Leu 
555 600 505 

Arc Asn Thr Lys Leu Asn Ala Ala Lys Ala Leu Glu Thr Thr Ala Leu 

610 615 620 

Gin Gly Asn lie Val Ser Asp Gly Leu His Aia Vai Ser Ala Asp Gly 
625 630 635 640 

His Val Ser Leu Leu Ala Asn Giy Asn Ala Asp Phe Thr Gly His Asn 
645 650 655 

Thr Leu Thr Ala Lys Ala Asp Val Asn Ala Gly Ser Vai Gly Lys Gly 
660 665 670 

Arg Leu Lys Ala Asp Asn Thr Asn lie Thr Ser Ser Ser Gly Asp lie 
675 680 685 

Thr Leu Val Ala Giy Asn Gly lie Gin Leu Gly Asp Giy Lys Gin Arg 
690 695 700 

Asn Ser lie Asn Gly Lys His lie Ser He Lys Asn Asn Gly Gly Asn 
705 710 715 720 

Ala Asp Leu Lys Asn Leu Asn Val His Ala Lys Ser Gly Aia Leu Asn 
725 730 735 

lie His Ser Asp Arg Ala Leu Ser He Glu Asn Thr Lys Leu Glu Ser 
740 745 750 

Thr His Asn Thr His Leu Asn Ala Gin His Glu Arg Val Thr L u Asn 
755 760 765 
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Gin Val Asp Ala Tyr Ala His Arg His Leu Ser lie Thr Gly Ser Gin 
770 775 780 

lie Trp Gin Asn Asp Lys Leu Pro Ser Ala Asn Lys Leu Val Aia Asn 
785 790 795 300 

Gly val Leu Ala Leu Asn Ala Arg Tyr Ser Gin lie Ala Asp Asn Thr 
805 810 815 

Thr Leu Arg Ala Gly Ala lie Asn Leu Thr Ala Gly Thr Ala Leu Val 
820 825 830 

Lys Arg Gly Asn lie Asn Trp Ser Thr Val Ser Thr Lys Thr Leu Glu 
835 840 845 

Asp Asn Ala Glu Leu Lys Pro Leu Ala Gly Arg Leu Asn lie Glu Ala 
850 855 860 

Gly Ser Gly Thr Leu Thr lie Giu Pro Ala Asn Arg lie Ser Ala His 
865 370 875 880 

Thr Asp Leu Ser He Lys Thr Giy Gly Lys Leu Leu Leu Ser Aia Lys 
885 890 895 

Gly Giy Asn Ala Gly Aia Pro Ser Ala Gin Val Ser Ser Leu Glu Ala 
900 905 910 

Lys Gly Asn lie Arg Leu Val Thr Gly Glu Thr Asp Leu Arg Gly Ser 
915 920 925 

Lys lie Thr Ala Gly Lys Asn Leu Val Val Ala Thr Thr Lys Gly Lys 
930 935 940 

Leu Asn He Glu Ala Val Asn Asn Ser Phe Ser Asn Tyr Phe Pro Thr 
945 950 955 960 

Gin Lys Ala Ala Glu Leu Asn Gin Lys Ser Lys Glu Leu Glu Gin Gin 
965 970 975 

He Ala Gin Leu Lys Lys Ser Ser Pro Lys Ser Lys Leu lie Pro Thr 
980 985 990 

Leu Gin Glu Glu Arg Asp Arg Leu Ala Phe Tyr He Gin Ala He Asn 
995 1000 1005 
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Lys Glu vai Lys Gly Lys Lys Pro Lys Gly Lys Glu Tyr Leu Gin Ala 

1015 1020 

Lys Leu Ser Ala Gin Asn He Asp Leu He Ser Ala Gin Gly lie Glu 
10 — 10 30 103 5 ;o^O 

■ He Ser Gly Ser Asp He Thr Ala Ser Lys Lys Leu Asn Leu His Ala 
1045 1050 loss 

Ala Gly Vai Leu Pro Lys Aia Aia Asp Ser Glu Ala Ala Ala He Leu 
1060 1065 1070 

He Asp Gly lie Thr Asp Gin Tyr Glu He Gly Lys Pro Thr Tyr Lys 
1075 1080 1085 

Ser His Tyr Asp Lys Ala Aia Leu Asn Lys Pro Ser Arg Leu Thr Gly 
-090 1095 1100 

Arg Thr Gly v a i Ser lie His Ala Ala Ala Ala Leu Asp Asp Aia Arg 
1105 1110 1115 1120 

lie He He Gly Ala Ser Glu He Lys Ala Pro Ser Gly Ser He Asp 
1125 H30 1135 

He Lys Aia His Ser Asp He Vai Leu Glu Ala Gly Gin Asn Asp Ala 
U40- H45 1150 

Tyr Thr Phe Leu Lys Thr Lys Gly Lys Ser Gly Lys He lie Arg Lys 
1155 H60 1165 

Thr Lys Phe Thr Ser Thr Arg Asp His Leu He Met Pro Ala Pro Vai 
1170 1175 H80 

Glu Leu Thr Ala Asn Gly lie Thr Leu Gin Aia Gly Gly Asn lie Glu 
1185 U90 H95 1200 

Ala Asn Thr Thr Arg Phe Asn Aia Pro Ala Gly Lys Vai Thr Leu Vai 
1205 1210 1215 

Ala Gly Glu Glu Leu Gin Leu Leu Ala Glu Glu Gly He His Lys His 
12 20 1225 1230 

Glu Leu Asp Vai Gin Lys Ser Arg Arg Phe He Gly He Lys Vai Gly 
!235 1240 1245 
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Lys Ser Asn Tyr Ser Lys Asn Glu Leu Asn Glu Thr Lys Leu Pre Val 
1250 1255 1260 

Arc Val Val Ala Gin Thr Aia Ala Thr Arg Ser Gly Trp Asp Thr Val 
1265 1270 1275 1230 

Leu Glu Gly Thr Glu Phe Lys Thr Thr Leu Ala Gly Ala Asp lie Gin 
1235 1290 1295 

Ala Gly Val Gly Glu Lys Ala Arg Val Asp Ala Lys lie He Leu Lys 
1300 1305 1310 

Gly lie Val Asn Arg lie Gin Ser Glu Glu Lys Leu Glu Thr Asn Ser 
1315 1320 1325 

Thr Vai Trp Gin Lys Gin Aia Gly Arg Gly Ser Thr lie Glu Thr Leu 
.330 1335 1340 

Lys Leu Pro Ser Phe Glu Ser Pro Thr Pro Pro Lys Leu Ser Aia Pro 
1345 1350 1355 1360 

Gly Giy Tyr lie Val Asp He Pro Lys Gly Asn Leu Lys Thr Glu lie 
1365 1370 1375 

Glu Lys Leu Ser Lys Gin Pro Giu Tyr Aia Tyr Leu Lys Gin Leu Gin 
138C 1385 1390 

Val Aia Lys A^n lie Asn Trp Asn Gin Val Gin Leu Aia Tyr Asp Arg 
1395 1400 1405 

Trp Asp Tyr Lys Gin Glu Gly Leu Thr Glu Ala Gly Ala Ala He lie 
1410 1415 1420 

Ala Leu Ala Val Thr Val Vai Thr Ser Gly Ala Gly Thr Gly Aia Val 
1425 143C 1435 1440 

Leu Gly Leu Asn Gly Ala Ala Ala Ala Ala Thr Asp Ala Ala Phe Ala 
1445 1450 1455 

Ser Leu Ala Ser Gin Ala Ser Val Ser Phe He Asn Asn Lys Gly Asp 
1460 1465 1470 

Val Gly Lys Thr Leu Lys Glu Leu Gly Arg Ser Ser Thr Vai Lys Asn 
1475 1480 1485 
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Leu Val val Ala Aia Ala Thr Ala Gly Vai Ala Asp Lys lie Giy Ala 
H90 U95 1500 

Ser Ala Leu Asn Asn Vai Ser Asp Lys Gin Trp lie Asn Asn Leu Thr 
1505 1510 1515 1520 

Vai Asn Leu Ala Asn Ala Gly Ser Ala Aia Leu lie Asn Thr Ala Val 
1525 1530 1535 

Asn Gly Giy Ser Leu Lys Asp Asn Leu Glu Ala Asn lie Leu Ala Ala 
1540 1545 1550 

Leu Val Asn Thr Ala His Gly Glu Ala Ala Ser Lys He Lys Gin Leu 
1555 1560 1565 

Asp Gin His Tyr lie Val His Lys lie Ala His Aia He Ala Gly Cys 
1 57 ° 1575 1580 

Ala Ala Ala Ala Ala Asn Lys Gly Lys Cys Gin Asp Gly Ala lie Gly 
1585 1590 1595 1600 

Ala Aia Val Gly Glu He Val Gly Glu Ala Leu Thr Asn Gly Lys Asn 
1605 1610 1615 

?rc Asp Thr Leu Thr Ala Lys Glu Arg Glu Gin He Leu Ala Tyr Ser 
1620 1625 1630 

Lys Leu Vai Aia Gly Thr Val Ser Gly Val Val Gly Gly Asp Val Asn 
! g 35 1640 1645 

Aia Ala Ala Asn Ala Ala Glu Val Ala Val Lys Asn Asn Gin Leu Ser 
1650 1655 1660 

Asp Lys Glu Gly Arg Glu Phe Asp Asn Glu Met Thr Aia Cys Ala Lys 
1665 1670 1675 1680 

Gin Asn Asn Pro Gin Leu Cys Arg Lys Asn Thr Val Lys Lys Tyr Gin 
1685 1690 1695 

Asn Val Ala Asp Lys Arg Leu Ala Ala Ser He Ala He Cys Thr Asp 
1700 1705 1710 

He Ser Arg Ser Thr Glu Cys Arg Thr He Arg Lys Gin His Leu He 
1 ? 15 1720 1725 
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Asp Ser Arg Ser Leu His Ser Sar Trp Glu Ala Gly Leu lie Gly Lys 
1730 1735 1740 

Asp Asp Glu Trp Tyr Lys Leu ?he Ser Lys Ser Tyr Thr Gin Ala Asp 
1745 1750 1755 1760 

Leu Ala Leu Gin Ser Tyr His Leu Asn Thr Ala Ala Lys Ser Trp Leu 
1765 1770 1775 

Gin Ser Gly Asn Thr Lys Pro Leu Ser Glu Trp Met Ser Asp Gin Gly 
1780 1735 1790 

Tyr Thr Leu lie Ser Gly Val Asn Pro Arg Phe lie Pro He Pro Arg 
1795 1300 1805 

Giy Phe Val Lys Gin Asn Thr Pro He Thr Asn Val Lys Tyr Pro Glu 
1810 1315 1820 

Gly lie Ser Phe Asp Thr Asn Leu Lys Arg His Leu Ala Asn Ala Asp 
1325 1830 1835 1840 

Gly Phe Ser Gin Glu Gin Gly He Lys Gly Ala His Asn Arg Thr Asn 
1845 1850 1855 

Phe Met Ala Glu Leu Asn Ser Arg Gly Gly Arg Val Lys Ser Glu Thr 
1860 1865 1870 

Gin Thr Asp lie Glu Gly lie Thr Arg lie Lys Tyr Glu He Pro Thr 
1875 1880 1885 

Leu Asp Arg Thr Gly Lys Pro Asp Gly Gly Phe Lys Glu He Ser Ser 
1890 1895 1900 

He Lys Thr Val Tyr Asn Pro Lys Lys Phe Ser Asp Asp Lys He Leu 
1905 1910 1915 1920 

Gin Met Ala Gin Asn Ala Ala Ser Gin Gly Tyr Ser Lys Ala Ser Lys 
1925 1930 1935 

lie Ala Gin Asn Glu Arg Thr Lys Ser lie Ser Glu Arg Lys Asn Val 
1940 1945 1950 

He Gin Phe Ser Glu Thr Phe Asp Gly He Lys Phe Arg Ser Tyr Phe 
1955 1960 1965 
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Asp Vai Asn Thr Gly Arg lie Thr Asn He His Pro Glu 
1^70 1975 1980 

(2) INFORMATIONS POUR LA SEQ ID NO : 39: 

(l) CARACTERISTICITHS DE LA SEQUENCE . 
(A} LONGUEUR: 143 aciaes amines 
(3) TYPE: acide amine 
(C) NOMBRE DE 3RINS: simple 
(DJ CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE: oeDCide 



I ix) CARACTERISTIGUE : 

(A) NCM/CLE: Peptide 
( 3 } EMPLACEMENT ; 1 . .14 3 



(XI) DESCRIPTION DE LA SEQUENCE : SEQ ZD NO: 39: 

Met Lys Asn Asn lie Phe Leu Asn Leu Asn Lys Lys Ser lie Asn Asn 
1 5 10 15 

Asn His Phe Vai lie Ser He Phe Phe Giu Thr lie Tyr Gin Phe Glu 
20 25 30 

Thr Lys Asp Thr Leu Leu Glu Cys Phe Lys Asn He Thr Thr Thr Gly 
35 40 45 

His Phe Gly Vai lie Gly Ala Gin Tyr Glu Lys He Asp Ala Thr Arg 
50 55 60 

Trp He Gly Asp Tyr Glu Glu Vai Asn Gly Phe Glu Tyr He Asp Lys 
65 70 75 ao 

Ala Pro Ser lie Tyr Phe Ser Vai Gly Asp Asp Phe Asn Pro Glu Giu 
85 90 95 

Leu He lie Pro lie Asn Leu Ala Tyr His Tyr Phe Asn He Ala He 
100 105 no 



Ser Asp Phe Leu He Ala His Pro Glu Tyr Gin Lys Lys Cys Lys Glu 
115 120 125 
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lie Gin Lys Thr Tyr Ser Gin Thr Asn Cys Ser Leu His Glu -Thr 
130 135 140 

(2) INFORMATIONS FOUR LA SEQ ID NO 40: 

(i) CARACTERISTICtTES DE LA SEQUENCE, 
f A ) LCNGUEUR: S33 acides amines 
(B) TYPE : acide amine 
(Ci NOMBRE DE BRINS : simple " 
(D) CONFIGURATION : lineaire 

(li) TYPE DE MOLECULE: peptide 



(ix) CARACTERISTIQUE: 

(A] NOM/CLE: Peptide 
(3) EMPLACEMENT: 1 33 3 



(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 40: 

Vai Leu Lys Thr Pro Pro Thr Leu Ala Ala Glu Leu Ser Gly Lys Thr 
15 10 15 

Gly Val Ser lie Ser Ala Pre Tyr Ala Asn Glu Asn Ser Arg lie Leu 
20 25 30 

Leu Ser Thr Thr Asp He Ser Ser Glu Asn Gly Lys He Lys He Gin 
35 40 45 

Ser Tyr Gly Asp Gin Tyr Tyr Tyr Ala Arg Gin Ser Glu Leu Tyr Thr 
50 55 60 

Phe Glu Arg Arg Ser Tyr Lys Thr Gly Lys Trp Tyr Asn Arg Lys His 
65 70 75 80 

He Thr Giu Val Lys Glu His Lys Asn Ala Lys Pro Asp Ala Val Asn 
85 90 95 

Leu Ser Ala Ser Gin Gly. He Asp He Lys Ser Gly Gly Ser lie Asp 
100 105 110 

Ala Tyr Ala Thr Ala Phe Asp Ala Pro Lys Gly Ser He Asn He Glu 
115 120 125 
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Ala Gly Arg Lys Leu Thr Leu Tyr Ala Va 1 Glu Glu Leu Asn Tvr Asp 
1 30 1 35 1*10 

Lys Leu Asp Ser Gin Lys Arg Arg Arg Phe Leu Giy lie Ser Tyr Ser 
1-15 150 15 5 uo 

Lys Ala His Asp Thr Thr Thr Gin Val Me c Lys Thr Ala Leu Pro Ser 
165 170 175 

Arg Vai Val Ala Glu Ser Ala Asn Leu Gin Ser Gly Trp Asp Thr Lys 
180 185 190 

Leu Gin Giy Thr Gin Phe Glu Thr Thr Leu Giy Gly Ala Thr lie Arg 
195 200 205 

Ala Giy Vai Gly Glu Gin Ala Arg Aia Asp Ala Lys lie lie Leu Glu 
210 215 220 

Gly lie Lys Ser Ser lie His Thr Glu Thr Vai Ser Ser Ser Lys Ser 
225 230 235 240 

Thr Leu Trp Gin Lys Gin Ala Gly Arg Gly Ser Asn He Glu Thr Leu 
245 250 255 

Gin Lau Pro Ser Phe Thr Gly Pro Vai Ala Pro Val Leu Ser Ala Pro 
260 265 270 

Gly Gly Tyr lie Val Asp lie Pro Lys Gly Asn Leu Lys Thr Gin lie 
275 280 285 

Glu Thr Leu Thr Lys Gin Pro Glu Tyr Ala Tyr Leu Lys Gin Leu Gin 
290 295 300 

Val Aia Lys Asn He Asn Trp Asn Gin Val Gin Leu Ala Tyr Asp Lys 
305 310 315 320 

Trp Asp Tyr Lys Gin Glu Gly Met Thr Pro Ala Ala Ala Ala Val Val 
325 330 335 

Val lie Val Val Thr Val Leu Thr Tyr Gly Ala Leu Ser Ala Pro Ala 
340 345 350 

Aia Ala Gly Thr Ala Giy Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala 
355 360 365 
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Ala Gly Thr Ala Ala Giy Thr Giy Val Ala Ala Gly Thr Ala Ala Thr 
370 375 330 

Thr Gly Val Ala Ala Gly Thr Ser Ala Ala Ala lie Thr Thr Ala Ala 
385 390 395 400 

Gly Lys Ala Aia Leu Ala Ser Leu Ala Ser Gin Ala Ala Val Ser Leu 
405 410 415 

lie Asn Asn Lys Gly Asp lie Asn His Thr Leu Lys Glu Leu Giy Lys 
420 425 430 

Ser Ser Thr Val Arg Gin Ala Ala Thr Ala Ala Val Thr Ala Gly Val 
4 35 4 40 4 45 

Leu Gin Gly lie Ser Giy Leu Asn Thr Gin Ala Ala Glu Aia Val Ser 
A50 455 460 

Lys His ?he His Ser Pro Ala Aia Gly Lys Leu Thr Ala Asn Leu He 
465 470 475 480 

Asn Ser Thr Ala Ala Ala Ser Vai His Thr Ala He Asn Gly Gly Ser 
485 490 495 

Leu Lys Asp Asn Leu Gly Asp Aia Ala Leu Gly Ala He Val Ser Thr 
500 505 510 

Vai His Gly Glu Val Ala Ser Lys lie Lys Phe Asn Leu Ser Glu Asp 
515 520 525 

Tyr lie Aia His Lys lie Ala His Ala Vai Ala Gly Cys Aia Ser Ala 
53C 535 540 

Val Aia Asn Lys Gly Lys Cys Arg Asp Gly Ala lie Gly Aia Ala Val 
545 550 555 560 

Gly Glu Met Val Gly Glu Thr Leu Leu Asp Gly Arg Asp Val Gly Lys 
565 570 575 

Leu Ser Pro Gin Glu Arg Gin Lys Val lie Ala Tyr Ser Gin lie He 
580 585 590 

Ala Gly Ser Ala Val Ala Leu Val Lys Giy Asp Val Asn Thr Ala Val 
595 600 605 
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Asn Ala Ala Thr Val Ala Va 1 Glu Asn Asn Ser Leu Leu Ala Arg Arg 
610 615 620 

Arg Val Asn He Arg Trp Thr Pro Arg Gin Glu Leu Glu His Glu Tyr 
6 25 630 635 5 4 0 

Ala lie Leu Glu lie Gin Ala lie Thr Asn Gin lie Arg Arg Leu Asp 
645 650 655 

Pro Lys Phe Asn Gly He Ala lie Leu Arg Thr Pro Gly Glu Pro Trp 
660 665 670 

Thr Arg His Asp Val Gin Thr Tyr Arg Gin Tyr Tyr Asn Gin Leu Arg 
575 680 685 

Glu Ser Arg Gly Phe Ala Val Glu Pro lie Tyr Arc lie Arg He Asn 
630 695 700 

Asn Gly Asn Glu Phe Asn Arg lie Met: Ser Ser Lys Tyr Pro Tyr Asn 
705 710 715 720 

Glu Leu Tyr Vai Ala Asn Pro Lys Ser Ala Thr Gly Tyr Phe Arg Val 
725 730 735 

Asp Ser Tyr Asp Pro Ala Thr Arg Glu lie lie Ser Arg Lys Phe Thr 
740 745 750 

Gin Phe Ser Gin lie Gin Glu Ser Thr Gly He Gly Tyr lie Lys Glu 
755 760 765 

Ala Vai Arg Lys Tyr Ser Pro Gly Thr Val lie Ser Asn Vai Pro Ser 
770 775 780 

Thr Pro Thr Thr He Arg Gly Arg Lys Leu Glu Giy Lys Leu He Leu 
785 790 795 800 

Glu Val Pro Ala Gin Val Asn Pro lie Pro Gin Ser Val Leu Arg Ala 
805 810 815 

Ala Gin Glu Glu Asn Val lie He Arg Asp Thr Thr Gly Arg lie Tyr 
820 825 830 

Lys 
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(2) INFORMATIONS POUR LA SEQ ID NO: 41. 

(l) CARACTER I STIQUES DE LA SEQUENCE: 
(A} LONGUEUR: 8 33 acides amines 
{3) TYPE: acide amine 
(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: proteme 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 41: 

Val Leu Lys Thr Pro Pro Thr Leu Aia Ala Glu Leu Ser Gly Lys Thr 
15 10 15 

Gly Val Ser lie Ser Aia Pro Tyr Aia Asn Giu Asn Ser Arg lie Leu 



Leu Ser Thr Thr Asp lie Ser Ser Glu Asn Gly Lys lie Lys lie Gin 
35 40 45 

Ser Tyr Gly Asp Gin Tyr Tyr Tyr Ala Arg Gin Ser Glu Leu Tyr Thr 
50 55 60 

Phe Glu Arg Arg Ser Tyr Lys Thr Gly Lys Trp Tyr Asn Arg Lys His 
65 70 75 80 

lie Thr Glu Val Lys Glu His Lys Asn Ala Lys Pro Asp Ala Val Asn 
85 90 95 

Leu Ser Aia Ser Gin Gly He Asp lie Lys Ser Gly Gly Ser lie Asp 
100 105 110 

Ala Tyr Ala Thr Ala Phe Asp Aia Pro Lys Gly Ser lie Asn lie Glu 
115 120 125 

Ala Gly Arg Lys Leu Thr Leu Tyr Ala Val Giu Glu Leu Asn Tyr Asp 
130 135 140 

Lys Leu Asp Ser Gin Lys Arg Arg Arg Phe Leu Gly lie Ser Tyr Ser 
145 150 155 160 

Lys Ala His Asp Thr Thr Thr Gin Val Met Lys Thr Ala Leu Pro S r 
L65 170 175 
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Arg Val Val Ala Glu Ser Ala Asn Leu Gin Ser Gly Trp Asp Thr Lys 
190 18 5 190 

Leu Gin Gly Thr Gin ?he Glu Thr Thr Leu Gly Gly Ala Thr lie Arg 
1?5 200 205 

Ala Gly v a i Gly Glu Gin Ala Arg Ala Asp Ala Lys lie Tie Leu Glu 
210 215 220 

Gly lie Lys Ser Ser lie His Thr Glu Thr Val Ser Ser Ser Lys Ser 
225 230 235 240 

Thr Leu Trp Gin Lys Gin Ala Gly Arg Gly Ser Asn lie Glu Thr Leu 
245 250 255 

Gin Leu Pro Ser Phe Thr Gly Pro Val Ala Pro Val Leu Ser Aia Pro 
260 265 270 

Gly Gly Tyr lie Val Asp He Pro Lys Gly Asn Leu Lys Thr Gin He 
275 280 285 

Giu Thr Leu Thr Lys Gin Pro Giu Tyr Aia Tyr Leu Lys Gin Leu Gin 
290 295 300 

Val Aia Lys Asn lie Asn Trp Asn Gin Val Gin Leu Ala Tyr Asp Lys 
305 310 315 320 

Trp Asp Tyr Lys Gin Glu Gly Met Thr Pro Ala Ala Aia Ala Val Val 
225 330 335 

Val He Val Val Thr Vai Leu Thr Tyr Gly Ala Leu Ser Ala Pro Ala 
340 345 350 

Ala Ala Gly Thr Ala Gly Aia Ala Gly Ala Gly Ala Gly Gly Ala Aia 
355 360 365 

Aia Gly Thr Ala Ala Gly Thr Gly Val Ala Aia Gly Thr Ala Ala Thr 
370 375 380 

Thr Gly Val Aia Ala Gly Thr Ser Ala Ala Ala lie Thr Thr Ala Ala 
385 390 395 400 

Gly Lys Ala Ala Leu Ala Ser Leu Ala Ser Gin Ala Ala Val S r Leu 
405 410 415 
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He Asn Asn Lys Gly Asp He Asn His Thr Leu Lys Glu Leu Gly Lys 

.120 425 4 30 

Ser Ser Thr Val Arg Gin Ala Aia Thr Ala Ala Val Thr Ala Gly Val 

435 440 445 

Leu Gin Gly lie Ser Gly Leu Asn Thr Gin Ala Ala Glu Ala Val Ser 

450 455 460 



Lys His Phe His Ser Pro Ala Ala Gly Lys Leu Thr Ala Asn Leu lie 

465 470 475 480 

Asn Ser Thr Ala Ala Ala Ser Val His Thr Aia He Asn Gly Gly Ser 

4B5 490 495 



Leu Lys Asp Asn Leu Gly Asp Aia 

5 00 

Val His Gly Glu Val Ala Ser Lys 
515 520 

Tyr He Ala His Lys He Ala His 
530 535 

Val Ala Asn Lys Gly Lys Cys Arg 
545 550 

Gly Glu Met Vai Gly Glu Thr Leu 
565 

Lau Ser Pro Gin Glu Arg Gin Lys 
580 

Ala Gly Ser Ala Val Ala Leu Val 

595 600 



Ala Leu Gly Aia He Vai Ser Thr 
5 0 5 510 

lie Lys Phe Asn Leu Ser Glu Asp 
525 

Ala Val Ala Gly Cys Ala Ser Aia 
540 

Asp Gly Ala He Gly Aia Aia Val 
555 560 

Leu Asp Gly Arg Asp Val Gly Lys 
570 575 

Val He Ala Tyr Ser Gin He He 
585 590 

Lys Gly Asp Val Asn Thr Ala Val 
605 



Asn Ala Ala Thr Val Ala Val Glu Asn Asn Ser Leu Leu Ala Arg Arg 
610 615 620 

Arg Val Asn He Arg Trp Thr Pro Arg Gin Glu Leu Glu His Glu Tyr 
625 630 635 640 

Ala He Leu Glu He Gin Ala He Thr Asn Gin He Arg Arg Leu Asp 
645 650 655 
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Pro Lys Phe Asn Giy lie Aia He Leu Arg Thr Pro Gly Giu Pro Trp 

665 670 

Thr Arg His Asp Vai Gin Thr Tyr Arg Gin Tyr Tyr Asn Gin Leu Arg 
675 680 685 

Glu Ser Arg Giy Phe Aia Val Glu Pre lie Tyr Arg lie Arc lie Asn 
5^0 695 700 

Asn Giy Asn Glu Phe Asn Arg He Met Ser Ser Lys Tyr Pro Tyr Asn 
705 710 715 720 

Glu Leu Tyr Vai Ala Asn Pro Lys Ser Ala Thr Gly Tyr. Phe Arg Val 
725 730 735 

Asp Ser Tyr Asp Pro Ala Thr Arg Glu He lie Ser Arg Lys Phe Thr 

745 750 

Gin Phe Ser Gin lie Gin Giu Ser Thr Gly lie Gly Tyr lie Lys Glu 
? 55 760 765 

Ala Vai Arg Lys Tyr Ser Pro Gly Thr Val He Ser Asn Val Pro Ser 
770 775 780 

Thr Pro Thr Thr lie Arg Gly Arg Lys Leu Glu Gly Lys Leu lie Leu 
785 ? 90 795 800 

Glu Val Pro Ala Gin Val Asn Pro lie Pro Gin Ser Vai Leu Arg Ala 
905 310 815 

Ala Gin Glu Glu Asn Val He He Arg Asp Thr Thr Gly Arg lie Tyr 
820 325 830 

Lys 



(2) INFORMATIONS POUR LA SEQ ID NO: 42: 

( i ) CARACTERISTigUES DE LA SEQUENCE : 
(A) LONGUEUR: 162 acides amines 
(BJ TYPE : acide amine 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: 1 in air 
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(ii) TYPE MOLECJLE: peptide 



PCT/FR97/01295 



( ix ) CARAC7Z3IS7ICUE : 

[A) NCM/CLS: Peptide 
(3) EMPLACEMENT : 1 . 162 



(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 42: 

Met Lys Lys Asp lie Phe Tyr Cys Glu Gin Trp Ser Tyr Giy Tyr Lys 
i 5 10 15 

Arg Leu His Lys Pro Phe Ser Glu Lys Gin Ala Glu Glu Lys His Leu 
20 25 30 

Lys Giy Glu Leu Tyr Thr Ala Val lie Gly Ser Ala Thr Gin Pro Glu 
35 40 45 

Tyr Vai lie Thr Leu Arg Glu Glu Vai Gly Phe Phe Ser Val Asn Phe 
SO 55 60 

Phe Asp Lys Phe Gly Arg Asp Tyr Leu Thr His Gin Phe Gin Lys Tyr 
65 70 75 80 

Ser Asn Ser Asn Tyr Tyr Phe Leu Ser Met Ala Val Trp Arg Asp Tyr 
85 90 95 

lie Thr Leu Glu Ser His Asp Leu Ala Glu Gly Tyr Thr Tyr Phe Phe 
100 105 110 

Asn Glu Asn Thr Asp Asp Cys Tyr Val Leu Lys Gin Asp Phe lie Asn 
115 120 125 

Asn Glu Arg Tyr Glu Lys Thr Glu Leu Tyr Ser Gin Lys Asp Lys Val 
130 135 140 

He Leu Phe Pro Lys Phe Gly Glu Tyr Asp Leu Val Leu Asn Pro Asp. 
145 150 155 160 

lie He 



(2) INFORMATIONS POUR LA SEQ ID NO: 43: 
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(l) CARACTIRISTIQUES CE LA SEQUENCE : 

(A) LONGUEUR: 90 acides amines 

(B) TYPE: acide amine 

(C> NCMERE DE BRIMS, simple 
(D) CONFIGURATION : lineal re 

(ii) TYPE CE MOLECULE . peptide 

(ix) CARACTERISTICUE: 

(A) NOM/CLE. Peptide 

(B) EMPLACEMENT: 1 . . 9 0 



(Xii DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 43: 

Met Asn Lys Arg Met Lys Met Cys Pro Ala Cys Gin Gin Gly Tyr Leu 
1 5 10 15 

Tyr His Ser Lys Pro Lys Tyr Leu His Asp Glu lie lie Leu Cys Asp 
20 25 30 

Glu Cys Asp Ala Val Trp Leu Lys Gly Met Asn lie Phe Tyr Gly Glu 
35 40 45 

Tyr Glu Lys Asp Phe Tyr Ser Tyr Val Pro Phe Met Glu Ser Gin Gly 
50 55 60 

lie Thr Ser Glu Cys lie Trp Glu Gly Asp Leu Phe Asp His Pro Tyr 
65 70 75 80 

Tyr Glu Asp Glu Asn Ser Asn Asp Met Asp 
35 90 

(2) INFORMATIONS POUR LA SEQ ID NO: 44: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 313 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS ; simple 

(D) CONFIGURATION: iineaire 

(ii) TYPE CE MOLECULE: peptide 
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(IX) CAHACTZHISTICUE: 

(A) MCM/CLc: Peptide 
(3) EMPLACEMENT: 1 . .313 



(Xll DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 44: 

Met Ser Ala Thr Glu lie Glu Lys Ala Lys Aid Lys lie Thr Ala Tyr 
15 10 15 

Ser Lys Leu Val Ala Gly Thr Ala Ser Ala Val Val Gly Gly Asp Vai 
20 25 30 

Asn Thr Ala Ala Asn Ala Ala Gin lie Ala Val Glu Asn Asn Thr Leu 
35 40 45 

Tyr Pro Arg Cys Vai Gly Ala Lys Cys Asp Glu Phe Gin Lys Glu Gin 
50 55 60 

Gin Lys Trp lie Arg Glu Asn Pro Glu Glu Tyr Arg Glu Val Leu Leu 
65 70 75 80 

Phe Gin Thr Gly Phe lie Pro lie He Gly Asp He Gin Ser Phe Val 
85 90 95 

Gin Ala Gin Thr Ala Ala Asp His Leu Phe Ala Leu Leu Gly Val Val 
100 105 110 

Pro Gly He Gly Glu Ser tie Gin Ala Tyr Lys Val Ala Lys Ala Ala 
115 120 125 

Lys Asn Leu Gin Gly Met Lys Lys Ala Leu Asp Lys Ala Ala Thr Val 
130 135 140 

Ala Thr Ala Gin Gly Tyr Val Ser Lys Thr Lys He Lys He Gly Gin 
145 150 155 160 

Thr Glu Leu Arg Val Thr Ala Ala Thr Asp Lys Gin Leu Leu Lys Ala 
165 170 175 

He Gly Glu Gly Arg Asp Thr Thr Gly Lys Met Thr Glu Gin Leu Phe 
180 185 190 

Asp Ser Leu Ala Lys Gin Asn Gly Phe Arg Val Leu Ser Gly Gly Lys 
195 200 205 
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Tyr Gly Gly Asn Asn Gly Pha Asp His Val Trp Gin Ala Ala Asp Gly 
210 215 220 

Ser Val Val Leu lie Val Glu Ser Lys Gin He Arg Asn Gly Thr Val 
225 230 235 240 

Gin Leu Asn Pro Asn Gly Ala Gly Gly Tyr Thr Gin Met Ser Glu Asp 
245 250 255 

Trp lie Arg Gin Val Leu Asp Gin Leu Pro Asp Gly Ser Pro Ala Lys 
260 265 270 

Ala Ala Val Phe Lys Ala Asn Lys Asn Gly Thr Leu Lys Thr Ala lie 
275 280 285 

Ala Gly Val Asp Arg Gin Thr Gly Lys Ala Val He Leu Pro Val Lys 
290 295 300 

Val Pro Ser Lys Thr Asn He Arg Arg 
305 310 

(2) INFORMATIONS POUR LA SEQ ID NO : 45: 

(i) CARACTER I ST I QUES DE LA SEQUENCE : 

(A) LONGUEUR: 311 acides amines 

(B) TYPE; acide amine 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(ix) CARACTER I ST I QUE : 

(A) NOM/CLE : Peptide 

( B ) EMPLACEMENT : 1 . . 3 1 1 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 45: 

Met Gly His Asn Met Met Thr Thr Gin Lys Trp Tyr Glu His He Thr 
15 10 15 

Asn Val II II Gly Asn Thr Ala Asn Phe Asn Ser Gly Cys Leu Asp 

20 25 30 
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Ser He Asp Tyr Val Asp Giu Arg Lys Gly Val Pro Leu Ala Ala Met 
35 40 45 

Gin His lie Phe Met Asp Val Arg Ala Ala Ala Ser His Ala Tyr Leu 
50 55 60 

Phe Glu His Asp Leu Lys Lys Phe Lys Gin Tyr Ala Tyr Val Ala Gly 
65 70 75 80 

Lys Leu Gly Val Leu Leu Ser Val Asn Ser Thr Asp Pro Glu Pro Phe 
85 90 95 

Phe Phe Pro Cys Asp Met Leu Asn lie Gin Asn Pro Met Phe Leu Met 
100 105 110 

Leu Met Ser Asp Ser Pro Gin Leu Arg Glu Phe Leu Val Arg Asn lie 
115 120 125 

Asp Asn lie Ala Asn Asp Thr Glu Ala Phe He Asn Arg Tyr Asp Leu 
130 135 140 

Asn Arg His Met He Tyr Asn Thr Leu Leu Met Val Glu Gly Lys Gin 
145 150 155 160 

Leu Asp Arg Leu Lys Gin Arg Ser Glu Lys Val Leu Ala His Pro Thr 
165 170 175 

Pro Ser Lys Trp Leu Gin Lys Arg Leu Tyr Asp Tyr Arg Phe Phe Leu 
180 185 190 

Ala Phe Ala Glu Gin Asp Ale. Giu Ala Me- Lys Ala Ala Leu Glu Pre 
195 200 205 

Leu Phe Asp Lys Lys Thr Ala Arg Met Ala Ala Lys Glu Thr Leu Ser 
210 215 220 

Tyr Phe Asp Phe Tyr Leu Gin Pro Gin He Val Thr Tyr Ala Lys He 
225 230 235 240 

Ala Ser Met His Gly Phe Asp Leu Gly He Asp Gin Glu He Ser Pro 
245 250 255 

Arg Asp Leu He Val Tyr Asp Pro Leu Pro Ala Asp Glu Tyr Gin Asp 
260 265 270 
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Leu Gin Asp Trp lie Asp Tyr Tyr 
290 295 

Phe Gly Asn Ala Lys Arg Glu 
305 310 
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Asp Leu Ser Tyr Pro Tyr Glu Tyr 
285 

Thr Phe Lys Thr Asp Lys Leu Vai 
300 



(2) INFORMATIONS POUR LA SEQ ID NO: 46: 

( i ) CARACTERISTIQUES DE LA SEQUENCE ; 
(A) LONGUEUR: 21 paires de bases 
(S) TYPE: nucleotide 
fC) NOMBRE DE BRINS : simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 46: 
GCCACCGGTA CGGAAACTGA A 

(2) INFORMATIONS POUR LA SEQ ID NO: 47: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LCNGUEUR: 3 0 paires de bases 

(B) TYPE: nucleotide 

fC) NOMBRE DE BRINS: simple 
(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

( i i i ) HYPOTHETIQUE : NON 

(iv) ANTI-SENS: NON 
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fxi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 47. 
CCTGAATTCA TGTCTATTCC ATTTTGAAGA 3 0 

(2) INFORMATIONS POUR LA SEQ ID NO: -18: 

(i] CARACTER I ST I QUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN fgenomique) 
{ I i i ) HYPOTHETIQUE : NON 
( lv) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 48: 
CCGAGATCTT TAACCCTTTG GG CTTAAGCG A 31 
(2) INFORMATIONS POUR LA SEQ ID NO: 49: 

(i) CARACTER I STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 9 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
fiii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 49: 
GGGAGATCTC CCGCTCGTGT TGTGCATTA 2 9 
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(2) INFORMATIONS POUR LA SEQ ID NO: 50: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 3 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRIMS: simple 

(D) CONFIGURATION : lineaire 

(li) TYPE DE MOLECULE; ADN (genomique) 
(ill) HYPOTHETIQUE : NON 
(iv) ANT I -SENS : NON 



{xi J DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 50: 

AAGAGATCTG CAGCCAAGGC TCTCGAAA 

(2) INFORMATIONS POUR LA SEQ ID NO: 51: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 
(A) LONGUEUR : 26 paires de bases 
(BJ TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

{11} TYPE DE MOLECULE : ADN (genomique) 
( i i i ) HYPOTHETIQUE : NON 
( iv) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 51: 
GGGAGATCTC AGGCTGCCGC CGTTGA 
(2) INFORMATIONS POUR LA SEQ ID NO: 52: 
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(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 2 8 pa ires de bases 

(B) TYPE; nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : ImSaire 

(ii) TYPE DE MOLECULE . ADN ( genomique ) 
( l i i ) HYPOTHETICUE : NGN 
(iv) ANTI-SENS: NON 



(Xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 52: 
GGGAGATCTC ACCCCAAGAA CGCCAAAA 2 8 

(2) INFORMATIONS POUR LA SEQ ID NO : 53: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTKET I QUE : NON 
(iv) ANTI-SENS. NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 53: 
GGGAGATCTG AACGTATAGT AATCTATCCA A 31 
(2) INFORMATIONS POUR LA SEQ ID NO : 54: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 



FEUILLE DE REMPLACEMENT (REGLE 2§) 



BNSDOCID: <WO_9802547A2 |_> 



WO 98/02547 PCT/FR97/01295 

108 

(li) TYPE DE MOLECULE; ADN (genomique) 
(in) HYP OTH ET I QUE : NON 
( iv) ANTI-SENS: NON 

(Xl) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 54: 
AGTGGCTCCT AG ;2 
(2) INFORMATIONS POOR LA SEQ ID NO: 55: 

(l) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHET I QUE : NON 
(iv) ANT I -SENS ; NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 55: 
AGCACTCTCC AGCCTCTCAC CGAG 2 4 

(2) INFORMATIONS POUR LA SEQ ID NO: 56: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(iil TYPE DE MOLECULE: ADN (genomique) 
( i i i ) HYPOTHET IQUE : NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE. SEQ ID NO: 56: 
AGTGGCTCTT AA 12 
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(2) INFORMATIONS POUR LA SEQ ID NO: 57: 

U) CARACTER I ST IQUES DE LA SEQUENCE: 

(A) LONGUEUR: 10 paires de bases 

(B) TYPE; nucleotide 

(C) NOMBRE DE BR INS . simple 

(D) CONFIGURATION: hneaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
' ( 1 1 i ) HYPCTHETIQUE : NON 
(iv) ANTI -SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO. 57: 
AGTGG CTGGC L 0 

(2) INFORMATIONS POUR LA SEQ ID NO: 58: 

(l) CARACTER I STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS : simple 
(DJ CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

( l i l ) KYPCTHET I QUE : NON 

(iv) ANTI -SENS : NON 

(XI) DESCRIPTION DE LA SEQUENCE . SEQ ID NO: 58: 
AGCACTCTCC AGCCTCTCAC CGAC 2 4 

(2) INFORMATIONS POUR LA SEQ ID NO: 59: 

(i) CARACTER I STIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE; ADN (genomique) 
(in) HYPOTHETIQUE : NON 
(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO; 59: 
GTACTTGCCT AG 

(2) INFORMATIONS POUR LA SEQ ID NO: 60: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 4 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ill TYPE DE MOLECULE: ADN (genomique) 
( i i i ) HYPOTHETIQUE : NON 
(iv) ANTI-SENS : NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 60: 
ACCGACGTCG ACTATCCATG AACG 
(2) INFORMATIONS POUR LA SEQ ID NO: 61: 

£i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(iii) HYPOTHETIQUE: NON 
(iv) AKTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 61: 
GTACTTGCTT AA 
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(2) INFORMATIONS POUR LA SEQ ID NO: 62: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 10 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lmeaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( l x i ) HYPOTHETIC^ : WON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 62: 
GTACTTGGGC 10 
(2) INFORMATIONS POUR LA SEQ ID NO: 63: 

(i) CARACTER I ST I QUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 4 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: imeaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( L l i ) HYPCTHETIQUE : NON 
(iv) ANT I -SENS . NON 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 63: 
ACCGACGTCG ACTATCCATG AACC 2 4 

(2) INFORMATIONS POUR LA SEQ ID NO: 6 4 

(i) CARACTER I ST IQUES DE LA SEQUENCE: 

(A) LONGUEUR: 12 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(iii TYPE DE MOLECULE: ADN (genomique) 
( l i i ) HYPOTHETIQUE ; NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID MO: 64: 
AATTCTCCCT CG 

(2) INFORMATIONS POUR LA SEQ ID NO: 65 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 4 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
fiii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 65: 
AGGCAACTGT GCTATCCGAG GGAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 66: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 14 0 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( i l i ) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(Xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 66: 
GATCAACTTT TCCCTGTTTG TCCCATTACC GGTTTGAATG AACCGATTGC GCGCCGCGCG 
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TGTTGTTGGA CATTACCTGC GATTCAGACG GTACGATTGA CGACTACATC GAGGAGAACG 120 
GCAATCAGGG TACAATGCTA 140 
[2] INFORMATIONS POUR LA SEQ ID MO: 67: 

(i) CARACTEPISTIQUES DE LA SEQUENCE 

(A) LCNGUEUR: 193 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE 3RINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADM (genomique) 
( l i ; ) HYPOTHETIQUE : MON 
(iv) ANTI-SENS: MON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 67 

GATCCGCGTA CTTGGTTTTT CATATTTTGC ATAGTCTTGT CGGTCGGGCA 7CTTCCCCGA 6 0 

CATCATCTAA ATTTGTCTTT ATTGGTTTTT ACGCCACTGA TTGCGGATAA ACAATATTCC 120 

GCCTTGCCGT CGCGAATGTT CAAGCTAGCC TGCATCACCG TAATCAGGTT GCCCGTTACC 130 

GAGCCTTCGA GA 192 

(2) INFORMATIONS POUR LA SEQ ID NO: 68: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 183 paires* de bases 
(3) TYPE: nucleotide 

( C) NOKBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 
( i i i ) HYPOTHETIQUE : MON 
(iv) ANTI-SENS: NON 

(xi | DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 68: 
GATCCGGCTG CCCGACGCGC GCAAAATTGC CGCCGAGGAA AGCGCGCACA ACCACGACGG 6 0 
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CAAAACCAGC GTATGGCAAT ACAAACATC7 CGTGTTCGGT ACGGCAGGCA 7TTTCT GCI7 
TGTCGGCGC3 GAGGTGTCTA TCGGTTCGTT GATGGTCAAC GTATTGGGTT ATCTGAAAGC 
GCTGGATC 

(2) INFORMATIONS POUR LA SEQ ID NO: 6 9 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 30 A pa ires de bases 

(B) TYPE: nucleotide 

(C) NCMBRE DE BRINS: simple 

(D) CONFIGURATION: Uneaire 

(ID TYPE DE MOLECULE: ADN (genomique) 
( i i i ) HYPOTKETIQUE : MCN 
(iv) ANT I -SENS: NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 69: 
GATCCCCCAC TTTACCTCGG GCAGA7TTTG CGCGTTCATT ACAATAGCGT ATTTATGCGT 
TTG CGTTTG C GCTVGCCGCT GCCCCCCCZC CGCCGG7ATG GGAAAACATC AATATGGCGG 
TATAAAGCGC GGTATGGCGG AAAACCTGCC GTTTCCAAGT TTTATTCATC TTTTATTCCT 
TGAGTTYGCC TTCACGGGAC GGGGCGGCGC GCGGAACGCG GGGTTCGGTA AACCGCCCGA 
TTCCGCGCCC GCCGAATTGC TGATTGAAAA GCTTACTTCC CCATTTTAAC TTTGCACACT 
GATC 

(2) INFORMATIONS POUR LA SEQ ID NO: 70: 

(i) CARACTERISTIQUES DE LA SEQUENCE . 

(A) LONGUEUR: 24 3 pa ires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DE MOLECULE: ADN (genomique) 



5 0 



120 



130 



140 



300 



304 
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till) HYPOTHETIQUE : NON 



(iv) ANTI-SENS . NCN 



C-ci) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7 



70 : 



GATCAGACCC ATTTTCAGCG CACCGTAAGC GCGGATTTTC TCGAA7TTTT CCAAAGCTGC 



GGCATCGTTG TTGATGTCGT CTTGCAACTC TTTGCCCGTG TAGCCCAAGT CGGCGGCAT7 



CAGGAAAACG GTCGGAATGC CCGCGTTGAT GAG CGTGG CT TTCAAACGGC CTATATTCGG 



130 



CACATCAATT 7CATCGACCA AATTGCCGGT TGGGAACATA CTGCCTTCGC CGTCGG CTGG 



ATC 



(2) INFORMATIONS POUR LA SEQ ID NO: 71 

(i) CARACTERI STIQUES DE LA SEQUENCE. 

(A; LONGUEUR. 2 36 paires de bases 

•15} TYPE : nucleotide 

tC) NCMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(li) TYPE DE MOLECULE: ADN (genomique) 

fill) HYP OTTnET I QUE : NCN 

( iv ) AMTI -SENS : MON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 71: 

CGGCGGCGTAGTccgccGcgACAGCGTTACCATAAGCGGGACAGACTACACCCCTTTATCT 
AACCCGCAAAGTTTGGATACGGAATTAAAATGGTTGCTTCAAGAAGCTCCCGA^ 
AAAATCCTTTCGACCGCGCCGTTTATCTCCATAATAATTTGGCGTATCTTCA^ 
AAAGATTGCAATAAACGTACTGCCAGAAACTGCATGACCTTGTCGCTGATGCGCTCCG 

(2) INFORMATIONS POUR ' LA SEQ ID NO: 72: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 280 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBR£ DE BRINS: simple 
CD) CONFIGURATION: lineaire 
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(ni TYPE DE MOLECULE ADN (-genonuquei 
( i 1 i t KYPOTKETIQUE : MON 
( iv) ANT I -SENS : NQN 

|:<ii CESC3IPTICN DE LA SEQUENCE : SEQ ID MO: 72 : 

CGGTCAATCA CAAGAAAGTC AG CCGTCTG A TGGCGAAGAC GGGGCTGAAG GCAGTGATAT 6 0 

GGCGGCGCAA ATACCGCTCG TTCAAAGGAG AAGTCGGCAA AATTGCGCCG AATATCCTGC 120 

GACGCTGTTT CCATGCAGAA AAGCCGAATG AGAAATGGGT AACGGACGTT GCCGAGTT CA 130 

ATCTAGGCGG AGAAAAGATA TACCTTTCTC CGATTATGGA TTTGTTTAAC GGGGAAATGG 2 AO 

TCAGTTACGG TATTCAGACC CGCCCGAC7T TCGATTTGGC 2 80 

(2) INFORMATIONS PCUR LA SEQ ID MO: 73: 

(i) CARACTER I ST I QUE S DE LA SEQUENCE: 

(A) LONGUEUR: 120 pa ires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BR INS simple 

(D) CONFIGURATION: hneaire 

(ii) T/PE DE MOLECULE. ADN (genomique) 
( i i l ) HYPOTHETIQUE : MON 
(iv) ANTI-SENS: NCN 

(xi J DESCRIPTION DE LA SEQUENCE: SEQ ID NO ' 73; 
CGGTCAGAAA CAGGCAAGGT AATGAAAATG CCTGAGGCAC GGACTGTGCT GCG A A CG AAA 6 0 

ACTCCTTACC GAAGTCTTCT ATACCCAGGC TCAATAGCCG CTCAAGGAGA GAGCTATCAT 120 
(2) INFORMATIONS POUR LA SEQ ID NO: 74: 

(i) CARACTER I STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 120 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION, lineal re 
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Ui) TYPE DE MOLECULE: ACN (genomique! 



(ui) 



HYFOTHETIQUE : NON 



[ iv ) ANT I -SENS ■ NCN 



(XI ) 



DESCRIPTION DE LA SEQUENCE. SEQ ID NO: 7 4 



CGGTCAGAAA CAGGCAAGGT AATGAAAATG CCTGAGGCAC GGACTGTGCT GCGAACGAAA 



SO 



•ACC GAAGTCTTCT ATACCCAGGC TCAATAGCCG CTCAAGGAGA GAGCTATCAT 



12C 



(2) INFORMATIONS POUR LA SEQ ID NO: 75: 

m CARACTERI STIQUES DE LA SEQUENCE . 

;A) LONGUEUR: 152 pa ires de bases 

:3i TYPE, nucleotide 

( C ) NOME RE CE BRIMS: simple 

(O) CONFIGURATION ' iineaire 

(ii) TYPE DE MOLECULE . ADN (genomique) 

{ l l l J HYPOTHET I QUE : WON 

( iv) ANTI-SENS: NON 

(XI) DESCRIPTION DE LA SEQUENCE. SEQ ID NO: 75: 

C3GTGTTTTT CTTAACAATT CGCCGACTTC ATGGCGATAT TTAAGTGACA GTTGCTCC3C 6 0 

CCACGCACTT GCGCCGAACT CAGCACCACG AC ATT AT ACT GATTATGCAC ATCGGCAAGA I2C 

TCAAACTGAC CTATCGTAGT ATCGCAGACT GT 15 2 

(2) INFORMATIONS POUR LA SEQ ID NO: 7 6 

U) CARACTERI STIQUES DE LA SEQUENCE : 

(A) LONGUEUR. 331 paires de bases 
(3) TYPE ■ nucleotide 

(C) NOMBRE DE BR INS . simple 

(D) CONFIGURATION: Iineaire 

(ii) TYPE DE MOLECULE. ADM (genomique) 
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(Hi) KYPOTHET I QUE : NGN 
(iv) ANTI-SENS : NGN 

(:<l) DESCRIPTION DE LA SEQUENCE: SEQ ID NO 76. 

CGGGAGGTTITGTGCATCCTGATACCGATCGGTTGTTGTTGCTCAAAGGACAGAAGGC 

CGCTGATA-A-\CGAGATTACCTGTTTGTCGCTATTGACGATTTTTATACTCTGCCATT^ 

GCCAGACAAAACCGCAGACAGTGCTGCCAAGTTTCTGACCGAACATCTGGCCGACCCC 

TGCTTGTACCTGATTGAGTACGCTTACTCTGACAATGATAGGTAATATAAAGAGCCGTC 

CA.^CATGCTTTCGGTGCAGTTTGTTATGATAATGGGATTGGTTGGAGGCTTGCCCGATT 

TGCTTGTCCGCAGACCAACGGTAAGGCGGAGCGGGTTATCCGTACCTTGATGGAG \TG 
TGGCATGAGGAACAGTCGTTTGACAGACCG 

(2) INFORMATIONS POUR LA SEQ ID NO: 77 

fi) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LGNGUEUR : 269 paires de bases 

(3) TYPE: nucleotide 

{C} NOMBRE DE BRIMS; simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genonuque) 

( i i l ) HYP OTHET I QUE : NON 

(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 77: 

CGGAGCATAA AATCGTTATT AAAGATAATG GTATAGGAAC GAGCTTCGAT GAAATCAATG 6 0 

ATTTTTATTT GAGAATCGGT CGGAACAGAA GGGAAGAAAA ACAAGCCTCC CCGTGCGGAA 120 

GAATTCCAAC GGGTAAAAAA GGCCTTGGTA AATTGGCATT ATTCGGGCTT GGCAACAAAA 130 

TTGAAATTTC TACTATCCAG GGAAACGAAA GGGTTACTTT TACTTTGGAT TATGCAGAGA 2 40 

TTCGAAGAAG CAAGGGTATT TATCAACCG 2 69 

(2) INFORMATIONS POUR LA SEQ ID NO: 78 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 203 paires de bases 
( 3 ) TYPE: nucleotide 
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(C) NCMBRE CE BRIMS simple 

(D) CONFIGURATION: imeaire 

(ii) TYPE DE MOLECULE. ADN (qenomique) 

( i l i ) HYPOTHETIQUE : NON 

!ivl ANTI -SENS : NCN 

(xi) DESCRIPTION CE LA SEQUENCE: SEQ ID NO: 78: 

CGGATGAAAACGGCATACGCecCAAAGTATTTACGAACATCAaAGGCTTG.AAGATACCG 
CACACCTACATAGAAACGGACGCGAAAAAGCTGCCGAAATCGACAGATGAGCAGCTTT 
CGGCGCATGATATGTACGAATGGATAAAGAAGCCCGAAAATATCGGGTCTATTGTCAT 
TGTAGATGAAGCTCAAGACGTATGGCCG 

(2) INFORMATIONS POUR LA SEQ ID NO: 79: 

(1) CAlRA CTER I ST I QUE S DE LA SEQUENCE: 

(A) LONGUEUR : 229 paires de bases 

fB) TYPE: nucleotide 

(CI NOMBRE DE 3RINS : simple 

ID) CONFIGURATION hneaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 

( i i l ) HYPCTHET I QUE ; NON 

fiv) ANTI -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 79 . 

CGGTTTCAGG TTGTCGCGAA GGCTCGGTAA CGGGCAACCT GATTACGGGT GATGCAGGCA 6 0 

GCTTGAACAT TCGCG ACGGC AAGGCGGAAT ATGTTTATCC GCAATGAGTG GCGTAAAAAC 120 

CAATAAAGAC AAATTTAGAT GATGTCGGGG AAGATGCCCG ACCGACAAGA CTATGCAAAA 13 0 

TATGAAAAAC CAAGTACGCG GATCAGGCAT GGATGCACGA TCCAATCCG 22 9 

(2) INFORMATIONS POUR LA SEQ ID NO: 80: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 07 paires de bases 
(S) TrTE: nucleotide 
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fC) NOMBRE DE BRINS. simple 
(D) CONFIGURATION: Uneaire 

TYPE DE MOLECULE: ADN (genomique) 

(in) HVPOTHETIQUE : NON 

(iv) ANT I -SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 80. 

CGGGTCG CTT TATTTTGTGC AGGCATTATT TTTCATTTTT GGCTTGACAG TTTGGAAATA 

TTGTGTATCG GGGGGGGGTA TTTGCTG A CG TAAAAAACTA TAAACGCCGC GCAAAATATG 

GCTGACTATA TTATTGACTT TGATTTTGTC CTGCGCGGTG ATGGATAAAA 7C3CCAGCGA 

TAAAGAATTT GCGAGAACCT GATGCCG 

(2) INFORMATIONS POUR LA SEQ ID NO: 81 • 

(l) CARACTER I ST IQLTE S DE LA SEQUENCE : 

(A) LONGUEUR: 224 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE. ADN (genomique) 
(ill) HYP OTHET I QUE : NON 
(iv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 81. 
CGGCAACGAT TTGAGCTATC GCGGTTACGA CATTCTGGAT TTGGCACAAA AATGCGAGTT 
TGAAGAAGTC GCCCACCTGC TGATTCACGG CCATCTGCCC AACAAATT CG AGCTGGCCGC 
TTATAAAACC AAGCTCAAAT CCATGCGCGG CCTGCCTATC CGTGTGATTA AAGTTTTGGA 
AAGCCTGCCT GCACATACCC ATCCGATGGA CGTAATGCGT ACCG 
(2) INFORMATIONS POUR LA SEQ ID NO: 82: 



60 
120 
180 



60 



120 



180 



224 
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(l) CARACTERISTIQUES DE LA SEQUENCE: 

f A ) LONGUEUR: 212 pa l res de bases 

(3) TYPE: nucleotide 

(C) NCMBRE DE BRINS : simple 

;D) CONFIGURATION: lmeaire 

(ii) TYPE DE MOLECULE: ADN (aenomique) 

(ill) KYPOTHETIQUE : NON 

(iv) ANTI-SENS: NON 

txi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 82. 

CGGGAACAGC CATTGCCCAC GCCCACGC" CCCAAGAAAG ACGGAAACTA CTGCCTAAAT 6C 

TTTCGGCAAT CAAGTTGACG ATTAAAGGGT TGGGGGCAGT TGCAGTAATA AACATAGCCG 120 

ACGAAATGGG ATTGGAATGA TAGTTGACCA AAGCCAAATA TTTACCCATC TTGCCTTCTG 130 

TGCCTTTTGC GGG ATTGG AG CC3TAAC7GC CG 2 12 

(2) INFORMATIONS POUR LA SEQ ID NO: 8 3 

(i) CARACTERISTIQUES DE LA SEQUENCE. 

(A) LONGUEUR: 35 3 pa ires de bases 
•3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(i:) TYPE DE MOLECULE. ADN (genomique) 
(ill) HYPOTHETIQUE : NON 
(iv) ANT I -SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 83 
CGGGAATTCT GAGCAGAATG AAAGAAAGCA GGCTTGATAA TTTCATAAAG TTATTGGAAG 60 
AAAAAGGATT TACCGTCCAT TTCGGTATTC ACAATACGGC TGATTACGGA ATTCCCCAAA 120 
GCCGT AAAAG ATTTACGTTA ATTGCAAACA GAATAACCAA AGAAAAGCTG GAACCAGTCA 180 
AGTATTCGGG CAAACGGCTT A CGGT AG CCG ATGTTTTGGG AATGGAAATG GCTTTCCCAA 2 40 
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CATTATTGCA GGACACCAAG ACGAAACGGA TTTTATGCAT AGCTGTCCGG GAATTATCTG 3CC 

ATATCACTTG AACGATTGGC TTGATACCTA AAAACGGAGG AACCGTTGGC TTT ' 35: 

(2) INFORMATIONS POUR LA SEQ ID NO: 3 4 

( i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 3 03 pa ires de bases 

(5) TYPE: nucleotide 

(O) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(11) TYPE DE MOLECULE: ADN (genomique) 

(ill) HYPOTHET IQUE : NON 

(iv) ANT I - SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 84: 
AATTCCGTAT CCAAACTTTG CGGGTTAGAT AAAGGGGTGT AGTCTGTCCC GCTTATGGTA 
ACGCTGTCGC GGCGGACTAC GCCCGGACCC TTTTTCCAGT AAGTTTTCGG AAATCAGGCT 
GTGGCTGOTT TTTAAGAAAT CCAACCAGTC AAACGGCTCG GGGCTGTCCA AACCGGACAC 
AGGTGCCGGT AACTTTCCCT CAGGTTGATT AACATTACGG CATCCGAATA TAACITCCCG 
CCTGCGG TTT GCCCGAGTTT AAGCAATGCC TGCGTATCGT ATTGATTATA AAGTGTTTCC 
TTCCAATT 

(2) INFORMATIONS POUR LA SEQ ID NO : 85: 

( i ) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 104 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
( i i i ) H YPOTHET I QUE : NON 



60 



12C 



180 



240 



30C 



'SOc 



Dwcnnrirv >uun oo/v>&47ao 



FEUILLE DE REMPLACEMENT (RE6LE 2$) 



WO 98/02547 PCT/FR97/0 1 295 

123 

(iv) ANTI-SENS: NCN 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO" 85: 



AATTCGTGTG CCGCGTCGAC AAACCGCTGA CGTAGCGGAT GTCTCATGCC ACGTTTCAAA 



SO 



GCAGGTTGAT GGCGGTT AG C AACCCTCTGA TTTCA CT&ZG ATAT 



104 



(2) INFORMATIONS POUR LA SEQ ID NO: 86: 

(1) CARACTERISTIQUES DE LA SEQUENCE . 

(A) LONGUEUR: 3 9 pa ires cie bases 
(3) TYPE: nucleotide 
(C) NOMBRE DE 3RINS . simple 
fD) CONFIGURATION: linear re 

(li) TYPE DE MOLECULE: ADN (genomique) 



fill) HYPOTHET I QUE : HON 
(iv) ANTI-SENS: NON 



(xij DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 86: 

AATTGCGTAG AGTGGGCTTC AGCCACGTTT TTTCTTTTTC GGTCGTTGAT TGGTGGGCTG 

AACCACTTGT TTCGGAAATC CGTATCATG 

(2) INFORMATIONS POUR LA SEQ ID NO: 87: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

E A ) LONGUEUR: 273 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE SRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(iii) HYPOTHET IQUE : NON 
(iv) ANTI-SENS : NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 87: 
AATTTCCA CC TATGCCCTAC G C AG CG ATT A TCCGTGGTTT ACCCAAAGGG TGATTATGGC 
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AAA AG CGCGG GGTTGAGCGA CCGCCTTTTG TTGCCGGGGT TCAAACGGGT TTTGATAGGA 120 
AATGCAGGCA CGAAGCCTCG GCTGATTGTG ATGCACCTGA TGGGTTCGCA CAGTGATTTT 130 
TGCACACGTT TGGATAAGGA TGCGCGGCGG TTTCAGTATC AAACTGAAAA AATATCCTGC 



TATGTTTGGA TCAATCG CGC AAACCGATAA ATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 88: 

(l) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LCNGUEUR: 270 paires de bases 
(3) TYPE: nucleotide 

(C) NCMERE DE BRINS : simpie 

(D) CONFIGURATION, lineaire 

(ii) Tr^PE DE MOLECULE ADN (genomique) 
(ill) HYPOTHET I QUE : NON 
C iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 88: 

AATTCTTCCG CACGGGGAGG CTTGTTTTTC TTCCCTTCTG TTCCGACCGA TTCTCAAATA 

AAAATCATTG ATTTCATCGA AGTTCATTCC TATACCATTA TCTTTAATAA CGATTTTATG 

CTCCGGTTTA TCGAATAACC TAACTTCCAC TTCCGTAGCA CATGCATCGT AGGCATTCGC 

TATCAACTCG GCAATCGCAG G AA CAGTGTG CGAATACAAT CTTTACACCC AAATGTTCGA 

TTACGGTTGG CTCGAAACTC AATTTCAATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 89: 

(i) CARACTER I STI QUES DE LA SEQUENCE: 

(A) LONGUEUR: 267 paires de bases 
(3) TVPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN (genomique) 



i 4 0 



60 



12C 



180 



240 



270 
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(in) HYPOTHETIQUE : NON 
(iv) ANT I -SENS. NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NC : 89; 
AATTATGAAC ACACGCATCA TCGTTTCGGC TGCGTTCGTT GCGTTGGCAT TAGCAGGTTG iO 
CGGCTCAATC AATAATGTAA CCGTTTCCGA CCAGAAACTT CAGGAACGTG CCGCGTT73C 120 
CTTGGG CGTC ACCAATGCCG TAAAAATCAG CAACCGCAGC AATGAAGGCA TACGCATCAA 130 
CTTTACCGCA ACTGTGGGTA AGCGCGTGAC CAATGCTATG TTACCAGTGT AATCAGCACA 2 40 

ATCGGCGTTA CCACTTCCGA TGCAATT 2 67 

(2) INFORMATIONS FOUR LA SEQ ID NO: 90: 

(i) CARACTERISTIQLTES DE LA SEQUENCE: 

(A) LONGUEUR: 234 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN ( genomique ) 
(iii) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 90: 
AATTTTTATT TGGTTCGTAG TCATTTTGTG CAACTGAACG ATATTCGTTT TCATCATTGC 6 0 

TAACGTCTAG TGCCCATTGT GGCCCGTAAT AAGAGATTTC GTCTCCTTTT ACATGTTTGA 120 
CGCTGACGGC ATACTGGGGA TCGATGACGG ATAATGTACG TCTGTTGACA TCTGCAACGC 180 
TAAATCAATC ATCGGTATTG GATAATGCGT TGCCGATGTT TTGACTTGTA TGTT 2 34 

(2) INFORMATIONS POUR LA SEQ ID NO: 91: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 295 pa ires de bases 

(B) TYPE: nucleotide 
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;C) NCMBRE DE BR INS ; simple 
t'D) CONFIGURATION: iineaire 

(ill TYPE DE MOLECULE * ACN -genomiquei 

( i i 1 ) KYPOTHETIQUE : NGN 

(iv) ANT I -SENS NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 91: 
AATTCGGCCG GCTGTGTCAA ATAATGCGTT ACTTTGGCCG GGTCTTGTTC TTTGTAAGTG 5 0 

GTGGTCTTTT TTTGCGCGTT ATCCCCATCT GTTTGAGTGC ATAGCAAATG GTGGCTG CCG 120 
TACAATCAAA TGTTTGGCGT TCATGCAGAT AGGCATCATG GTGTTGCCCA ATATATTGAG 18C 
CCGGTTTTTG CCTATCCGAT TTGACGGCAT TTAGACCGGT AACTTGATGT TTTAAGCTGC 2 AO 

CTGTTTGTTT AAAGGCGAAT CCACAAGTAA AGCGTGTTTC TTGACAGGTT AAACG 2 9S 

(2) INFORMATIONS POUR LA SEQ ID NO: 92: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 59 pa ires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: iineaire 

(ii) "TrTE DE MOLECULE: ADN (genomique) 
( i i i ) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 92: 
AATTG TGT AT ATCAAGTAGG ATGGGCATTT ATGCCTGACC TACAAAACCA AAAACAACCT 6 0 

ACCACCCTTA ATCAACTCCA CAAACCCTCT TCAGACAACC TCGTTTTTTG AAAAACAATC 120 
TGTAAACAGA TAACTGCTGA AGAATACCGT TGCCGAGCCC CAAAACCCGT ACTGCAACTT 180 
TTATTGTGAA CTTCCCATTA TGAGAAAATC CCTTTTCGTC CTCTTTCTGT ATTCGTCCCT 2 40 
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ACTTACTGCC AGCGAAATT 
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{2} INFORMATIONS POUR LA SEQ ID NO: 93: 

(i) CARACTERISTIQUES DE LA SEQUENCE 

(A) LONGUEUR: 3 79 pa ires de bases 
O) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineal re 

fii] TYPE DE MOLECULE: ADN (genomique) 

( 1 i i ) HYPCTHETIQUE : NON 

(iv) ANT I -SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9 3 



AATTGCACCA CGCGATGATG GGTACGCCTC TGTTGCCATT GCGACCGCCG CCGCCGTGCC 



60 



CGGTACGCTG GTCAACCTTG CCGCGGCGGA ACGGGTAAAG AAGTGCGCTT CGGGCATCCT 



12C 



TCCGGTACAT TGCGCGTCGG TGCAGCGCCG AATGTCAGGA CGGACAATGG ACGGCCACG! 



180 



AAGCGGTTAT GAGCCGCAGC GCACGCGTGA TGATGGAAGG TTGGGTCAGG GTGCCGGAAG 



240 



ATTGTTTTTA AATTGGACGG CGAACCGGTC TATTCGTATT GGCGTTATAC CGCCG CAAAG 



300 



GCAGACCTTG AAACTGGTGC GTGCCGTGCA GGG CATGTAC GG CTATGTGT GCG TGGCGGG 360 



CGGATTTGAT GTGCGGAAT 



379 



(2) INFORMATIONS POUR LA SEQ ID NO: 94: 

(l) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 30 8 pa ires de bases 
{3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHETIQUE : NON 



Civ) ANT I -SENS : NON 
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(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 94: 
AATTTGTTGG GCAGATGGCC GTGAATCAGC AGGTGGGCGA CTTCTTCAAA CTCGCATTTT 
TGTGCCAAAT CCAGAATGTC GTAACCGCGA TACGTCAAAT CGTTGCCGGT ACGCAACGGT 
ACACAAAGCG GTATTACCGG CCGCAACGCC AGAAAGCGCA ACGGA7TTTT AGGTTTGAGG 
GTCGGGGTTT GAGTAGTTTC AGTCATGGTA TTTCTCCTTT GTGTTTTTAT GGGTTTCGGG 
TTTTCAGACG ACCGATG CGG ATTTGTTGAA AGGCAGTCTG AAAGCGGTAA ATCATTTTTG 
AAACAATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 95: 

(1) CARACTER I STI QUES DE LA SEQUENCE : 

(A) LONGUEUR: 286 paires de bases 

(B) TYPE . nucleotide 

(C) NOME RE DE BRINS : simple 

(D) CONFIGURATION: linea ire 

(li) TYPE DE MOLECULE: ADN (genomique) 
( i l i ) HYPOTHETIQUE ; NON 
(iv) ANTI-SENS : NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 95: 

AATTCGGAGG AGCA3TACCG CCAAGCGTTG CTCGCCTATT C CGG CGG TG A TAAAACAGAC 

GAGGGTATCC GCCTGATGCA ACAGAGCGAT TACGGCAACT TGTCCTACCA CATCCGTAAT 

AAAAACATGC TTTTCATTTT TTCGGCAAGC AATGACGCAC AAGCTCAGCC CAACACAACT 

GACCCTATTG CCATTTTATG AAAAAGACGC TCAAAAAGGC ATTATCACAG TTGCAGGCGT 

AGACCGCAGT GGAGAAAAGT TCAATGGCTC CAACCATTGC GGAATT 

(2) INFORMATIONS POUR LA SEQ ID NO: 96: 

(i) CARACTER I ST I QUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 38 pair s de bases 



60 



.20 



130 



240 



300 



308 
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120 
180 
240 
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(3) TYPE : nucleotide 

(C) NOMBRE DE 3P.INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE. ADN ( genomi que ) 
( l i i ) HYPOTHETIQUE . NON 
(iv) ANTI -SENS : NON 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NC : 96: 
AATTTGGATA CGTTGGAAAA GGGATATTTG ATTGGGAATG GGATGAAGAT AAGCGTAGAT 6 0 

G AGTTGGGG A AAAAAGTGTT AGAACATATC GGTAAGAATG AACCGTTATT GTTGAAAAAT 120 
CTACTGGTTA ACTTCAATCA GGGAAAACAT GAAGAAGTTA GGAAGTTGAT TTATCAGTTG 130 
ATAGAGTTAG ATTTTCTGGA ACTTTTGTGA GGGATTCTAT GAAAAACTGG AAGCAATT 2 38 

(2) INFORMATIONS POUR LA SEQ ID MO: 97- 

(i) CARACTER I ST I QUE S DE LA SEQUENCE: 

(A) LONGUEUR: 3 22 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineai re 

(ii) TYPE DE MOLECULE: ADN (genoxique) 
( l i i ) HYPOTHETIQUE : NON 
(iv) ANTI -SENS: NON 

(xi) DESCRIPTION DE LA SZQlfEHCE: SEQ ID NO: 97: 
AATTCGGCAC GCAGGTTTTC TAAAAAAAGG CCGTTGATGA CTTTGTCGAT ATTGGCGGCT 6C 
TCGGTGTAGT GCGCGCCCGC TTCGGCCGCT CTTGCGCGTC CATGACGGAT TGGAAGAGCG 120 
TGCCGAAGAT TTCTGGACTG ATGTTGCGCC AGTCGAAATT GCCGACA CGG GAGGAATACC 180 
TGCCAACAAG AGTGCAGGCA GCGTAATCAA ACCACCCCCA CCCGCAATCG CATCGATAAA 2 40 

TCCGGCAATC ATCGCAACCA AACCCAAAGC GAGTATTATG TATAAATCTT C CATGTTT CT 3 00 
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TAATCCTGTT AACTTGCACC AA 

(2) INFORMATIONS POUR LA SEQ ID NO: 98 

(i) CARACTER I ST IQUES DE LA SEQUENCE : 

fA) LONGUEUR: 315 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION : lmeaire 

(ii} TYPE DE MOLECULE: ADN (genomique) 
(ill) HYPOTHET I QUE : NON 
(iv) ANTI-SENS; NON 

(xi ) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 98 
AATTTGTCGG CAATCTTCCC GGGTCGCTTT ATTTTGTGCA GGCATTATTT TTCATTTTTG 6 0 

GCTTGACAGT TTGGAGATAT TGTGTATCGG GGGGGGGTAT TTGCTGACGT AAAAAACTAT 120 
AAACGCCGCA GCAAAATATG GCTGACTATA TTATTGACTT TGA 1T1TGTC CTGCGCGGTG 180 
ATGGATAAAA TCGCCAGCGA TAAAGATTTG CGAGAACCTG ATGCCGGCCT GTTGTTGAAT 2 AO 

ATTTTCGACC TGTAATTACG ATTTGGCTTC CGCGCCGGCA CAATATGCCG CCAAGCGGCG 3 00 

CCCACATTTT GGAAGC 3 16 
(2 J INFORMATIONS POUR LA SEQ ID NO: 99: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 217 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



PCT/FR97/01295 



(ii) TYPE DE MOLECULE: ADN (genomique) 



( i i i ) HYPOTHETIQUE : NON 
(iv) ANTI-SENS : NON 
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(xi) DESCRIPTION DE LA SEQUENCE . SEQ ID NO: 99: 

AATTCGGACA GTATGAATAC AGCGGATTAA TACAAGGTAA GTTCATTACA ACGGAAAAAC SO 

CTTTAAAGAA TAATATGAAA GGTATTACCT TGTTTGCCAA CGGGAATGGT AAATATGCCC 120 

GAGTTTTTCA CTG A AT AG CG AATCCAGCCA TTTCTATTCA TATTTGACTG GATGGCTGAA 13 G 

TGTGGACTTT ATAGATAATG ACGATGAAGA TTTAATT 217 
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REVENDICATIONS 
1/ ADN caracterises en ce qu'il s 1 agit de tout 
ou partie de genes, avec leur phase de lecture, presents 
chez Neisseria meningitidis (designee ci-apres par Nm ) , 
5 mais absents soit chez Neisseria gonorrhoeae (designee 
ci-apres par Ng ) , soit chez Neisseria Pactamica (designee 
ci-apres par Nl ) a 1' exception des genes impliques dans 
la biosynthese de la capsule polysaccharidique , frpA, 
frpC, opc, porA, rotamase, de la sequence IC1106, des IgA 
10 proteases, de la pilline, de pilC, des proteines qui 
lient la transferrine et des proteines d'opacite.. 

2/ ADN selon la revendication 1, caracterises 
en ce qu'ils sont presents chez Nm, mais absents chez Ng. 

3/ ADN selon la revendication 2, caracterises 
15 en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre tufA et pilT, ou region 1 du chromosome, et/ou la 
ou les sequence(s) nucleotidique( s ) capable(s) de 
s'hybrider avec la ou lesdites sequences. 
2° 4/ ADN selon la revendication 2, caracterises 

en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre pilQ et A740, ou region 2 du chromosome, et/ou la 
ou les sequence ( s ) nucleotidique( s ) capable ( s ) de 
25 s'hybrider avec la ou lesdites sequences. 

5/ ADN selon la revendication 2, caracterises 
en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm 22491 
entre argF et opaB, ou region 3 du chromosome, et/ou la 
ou les sequence(s) capable(s) de s ! hybrider avec la ou 
lesdites sequences . 

6/ ADN selon la revendication 3, caracterises 
en ce que leur sequence correspond, pour tout ou partie, 
a SEQ id n* 9, 13, 22 ou 30, et/ou a toute sequence se 
35 situant a plus ou moins 20 kb de ces SEQ ID sur le 
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chromosome d'une souche de Nm, et/ou est: capable de 
s'hybrider avec au moins un fragment de l'une quelconque 
de ces sequences, 

7/ ADN selon la revendication 4, caracterises 
5 en ce que leur sequence correspond pour, tout ou partie, 
a SEQ ID n* 1, 2, 4, 6, 7, 10, 15, 31 ou 34, et/ou, a 
toute sequence se situant a plus ou moins 20 kb de ces 
SEQ ID sur le chromosome d'une souche de Nm, et/ou est 
capable de s'hybrider avec au moins un fragment de l'une 

10 quelconque de ces sequences* 

8/ ADN selon la revendication 4, caracterises 
en ce qu'il s ' agit de tout ou partie de la sequence d 1 ADN 
SEQ ID N*36 ou de sequences correspondant aux cadres 
ouverts de lecture SEQ ID N # 37, SEQ ID N*38, SEQ ID N # 39, ^ 

15 SEQ ID N* 40, SEQ ID N*41, SEQ ID N # 42, SEQ ID N*43, SEQ - 
ID N*44, SEQ ID N*45 et/ou a toute sequence se situant a ; 
plus ou moins 20 kb de ces SEQ ID sur le chromosome d'une - 
souche de Nm, et/ou est capable de s f hybrider avec au 
moins un fragment de l'une quelconque de ces sequences. 

20 9/ ADN selon la revendication 5, caracterises 

en ce que leur sequence correspond, pour tout ou partie, :; 
a SEQ ID n' 8, 21, 23, 25, 26, 28, 29, 32 ou 35, et/ou, a 
toute sequence se situant a plus ou moins 20 kb de ces 
SEQ ID sur le chromosome d'une souche de Nm, et/ou est 

25 capable de s'hybrider avec au moins un fragment de l'une 
quelconque de ces sequences, 

10/ ADN selon la revendication 2, caracterises 
en ce que leur sequence correspond, pour tout ou partie, 
a SEQ ID n* 3, 5, 11, 12, 14, 16, 18, 19, 20, 24, 27 ou 

30 33, et/ou a toute sequence se situant a plus ou moins 20 
kb de ces SEQ ID sur le chromosome d'une souche de Nm, 
et/ou, est capable de s'hybrider avec au moins un 
fragment de l'une quelconque de ces sequences. 
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11/ ADN selon la revendication 1, caracterise 
en ce qu'ils sont communs avec ceux de Ng, mais sont 
absents de chez Nl . 

12/ ADN selon la revendication 11, caracterise 
en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre arg J et reg F , ou region 4 du chromosome et/ou la 
ou les sequence ( s ) nucleotique ( s ) capable ( s ) de 
s'hybrider avec la ou lesdites sequences. 

13/ ADN selon la revendication 11, caracterises 
en ce qu'ils comprennent une ou plusieurs sequence(s) 
telle(s) que presente(s) sur le chromosome de Nm Z2491 
entre le marqueur lambda 375 a pen A, ou region 5 du 
chromosome et/ou la ou les sequence(s) aucleotique(s) 
capable(s) de s'hybrider avec la ou lesdites sequences. 

14/ ADN selon 1 ' une quelconque des 
revendications precedentes, caracterise en ce qu'il code 
pour une proteine exportee au-dela de la membrane 
cytoplasmique . 

15/ ADN selon 1 1 une quelconque des 
revendications 1 a 14, caracterises en ce que tout ou 
partie de leur sequence correspond a une region conservee 
au sein de 1 1 espece Nm. 

16/ ADN selon 1 1 une quelconque des 
revendications 1 a 15, caracterise en ce qu 1 il est insere 
dans un vecteur de transfert ou d ' expression tel que 
cosmide, plasmide ou bacteriophage. 

17/ Cellule hote, plus particulierement cellule 
bacterienne ou cellule de Nm, transformee par 1 ' insertion 
d'au moins un ADN selon 1 * une quelconque des 
revendications 1 a 15. 

18/Cellule comportant des g6nes ou des 
fragments de genes specifiques de Nm, plus 
particulierement cellule bacterienne, ou cellule de Nm, 
dont le chromosome est delete d r au moins un ADN selon 
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l'une quelconque des revendications 1 a 15, en 
particulier d'un ADN responsable de la pathogenicity . 

19/ ARN, caracterises en ce que leur sequence 
correspond pour tout ou partie a la transcription d 1 au 
moins une sequence ou fragment de sequence d * ADN selon 
l'une quelconque des revendications 1 a 15. 

20/ Acides nucleiques anti-sens, caracterises 
en ce que leur sequence correspond a 1' anti-sens d'au 
moins une sequence nucleotidique selon l'une quelconque 
des revendications 1 a 15 ou 19, ou d'un fragment d'une 
telle sequence, et qu'ils portent, le cas echeant, au 
moins une substitution chimique telle qu'un groupe 
methyle et/ou un groupe glycosyle. 

21/ Polypeptides, caracterises en ce qu'ils 
presentent un enchainement d' acides amines correspondant 
a tout ou partie d T une sequence telle que codee par les 
acides nucleiques definis dans l'une quelconque des 
revendications 1 a 15 ou 19 , ou tel que deduit des 
sequences de ces acides nucleiques, avec, le cas echeant, 
des modifications par rapport aux sequences codees ou 
deduites des lors que ces modifications n ' alterent pas 
les proprietes biochimiques telles qu'observees chez le 
polypeptide natif . 

22/ Peptides selon la revendication 21, 
caracterises en ce qu'il s'agit de peptides exportes au- 
dela de la membrane cytoplasmique, plus specialement de 
peptides correspondant a tout ou partie de ceux codes par 
un ADN selon la revendication 14. 

23/ Anticorps, caracterises en ce qu'il s'agit 
d'anticorps polyclonaux ou monoclonaux diriges centre au 
moins un epitope d'un peptide selon la revendication 20 
ou 21, ou de fragments de ces anticorps, plus 
particuli^rement les fragments Fv, Fab, Fab' 2, ou encore 
d ' anti-anticorps capables de reconnaitre, selon une 
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reaction de type antigene-anticorps, lesdits anticorps ou 
leurs fragments. 

24/ Procede d'obtention de banques d 1 ADN 
Neisseria meningi tidis-specif iques , comprenant : 

- le melange de deux populations d'ADN, 

la realisation d'au moins une iteration 
d 1 hybridation-amplification soustractive, et 

- la recuperation du ou des ADN souhaites, 
suivie le cas echeant de leur purification avec 
1 1 elimination des sequences redondantes. 

25/ Procede selon la revendication 24, 
caracterises en ce que pour obtenir une banque Nm 
specifique par rapport a Ng 

- on melange deux populations d'ADN provenant 
respectivement d'une souche de Neisseria meningitidis , ou 
souche de reference, pour laquelle la banque specifique 
doit etre constitute, et d'une souche de Neisseria 
gonorrhoeae, ou souche de sous traction, les sequences 
d 1 ADN de ces souches etant telles qu'obtenues par 

. cisaillement aleatoire de 1 1 ADN chromosomique 
de la souche de sous traction, notamment par passages 
repetes a travers une seringue, et 

. clivage de 1 * ADN chromosomique de la souche 
de reference, de preference par une enzyme de restriction 
produisant des fragments de taille inferieure a Ikb 
environ, et que pour obtenir une banque d 1 ADN communs 
entre Nm et Ng, mais specif iques par rapport a Nl, on 
constitue trois banques differentes, dont deux par 
digestion de 1 1 ADN chromosomique de Nm par MBol et 
Tsp5091, et la troisitme, par digestion de 1 1 ADN 
chromosomique de Nm avec Mspl , on opere deux series de 
soustraction et on recupere les ADN presentant la 
specif icite recherchee. 
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26/ Banques de clones d r ADN trelles qu'obtenues 
par mise en oeuvre du procede selon la revendication 24 
ou 25 . 

27/ Application du procede selon la 
5 revendication 24 pour 1 ' obtention de banques d ' ADN 
specif iques d 1 une cellule donnee ou d'un variant donne 
d'une meme espece de cellule, des lors qu ' il existe une 
autre espece ou un autre variant proche genomiquement , 
et exprimant des pouvoirs pathogenes differents, en 
10 particulier de banques d 1 ADN specif iques de cryptocoques , 
d 1 Haemophilus, de pneumocoques ou encore d r Escherichia . 

28/ Methode de diagnostic d'une infection 
meningococcique, et plus particulierement de la meningite 
meningococcique, par mise en evidence de la presence de 
15 Neisseria meningitidis dans un echantillon biologique 
caracterisee en ce qu'elle comprend les etapes de : 

- mise en contact d'un echantillon biologique a 
analyser, avec un reactif elabore a partir d ! au moins un 
acide nucleique tel que defini dans l'une des 

20 revendications 1 a 15, ou 19, le cas echeant sous forme 
de sonde nucleotidique, ou d ! amorce, ou en variante a 
partir d'au moins un anticorps, ou un fragment 
d' anticorps, tel que defini dans la revendication 23, 
dans des conditions permettant respectivement une 

25 hybridation ou une reaction de type antigene-anticorps, 
et 

revelation du produit de reaction 
eventuellement forme . 

29/ Methode de diagnostic d ! une reaction 
30 immunitaire specif ique de 1 ? infection meningococcique, 
caracterisee en ce qu'elle comprend les etapes de ; 

- mise en contact d'un echantillon biologique a 
analyser avec au moins un polypeptide selon 1 ' une 
quelconque des revendications 21 ou 22 ou d'un anti- 

35 anticorps selon la revendication 23, ou d • un fragment de 
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celui-ci, ces produits etant, le cas echeant, marques 
dans des conditions permettant la realisation d'une 
reaction de type antigene-anticorps , et 

revelation du produit de reaction 
eventuellement forme . 

30/ Kits pour la mise en oeuvre d'une methode 
selon l'une quelconque des revendications 28 ou 29, 
caracterises en ce qu'ils comportent : 

- au moins un reactif tel que defini dans la 
revendication 28 ou 29, a savoir de type acide nucleique, 
anticorps ou peptide , 

- les produits, notamment marqueurs ou tampons, 
permettant la realisation de la reaction d ' hybridation 
nucleotidique ou de la reaction immunologique visee, 

15 ainsi qu'une notice d ' utilisation, 

31/ Composition vaccinale incluant dans son 
spectre, en particulier en association avec au moins un 
vaccin pour l'enfance, une prophylaxie a visee anti- 
meningococcique, et destinee a prevenir toute forme 
d* infection par Neisseria meningitidis, caracterisee en 
ce qu'elle comprend, en association avec un/des 
vehicule(s) physiologiquement acceptable ( s ) , une quant ite 
efficace : 

- de peptide selon la revendication 21 ou 22, 

25 ou 

- d* anticorps ou de fragment d 1 anti-anticorps 
selon la revendication 23, 

ce materiel etant eventuellement conjugue, afin de 
renforcer son immunogenic! te, a une molecule porteuse 

30 telle que proteine de polyovirus, toxine tetanique, 
proteine issue de la region hypervariable d'une piline. 

32/ Composition vaccinale incluant dans son 
spectre, en particulier en association avec au moins un 
vaccin pour l'enfance, une prophylaxie a visee anti- 

35 meningococ^xque, et destinee a prevenir toute forme 
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Figure 2 
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Figure 4 
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Figure 5 
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Figure 8B 
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Figure 9 
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